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本 章 首先 简要 介绍 Go 语言 的 发 展 历史 ， 并 较 详 细 地 分 析 了 "Hello World" 程 序 在 各 个 祖先 语言 
中 演化 过 程 。 然 后 ， 对 以 数组 、 字 符 囊 和 切片 为 代表 的 基础 结构 ， 对 以 函数 、 方 法 和 接口 所 
体现 的 面向 过 程 和 鸭子 对 象 的 编程 ， 以 及 Go 语言 特有 的 并 发 编程 模型 和 错误 处 理 哲 学 做 了 简 
单 介绍 。 最 后 ， 针 对 macOS、Windows、Linux 几 个 主流 的 开发 平台 ， 推 荐 了 几 个 较 友 好 的 
编辑 器 和 集成 开发 环境 ， 因 为 好 的 工具 可 以 极 大 地 提高 我 们 的 效率 。 


Go 语言 


1.1. Go 语言 创世纪 


Go 语言 最 初 由 Google 公 司 的 Robert Griesemer、Ken Thompson 和 Rob Pike 三 个 大 牛 于 2007 
年 开始 设计 发 明 ， 设 计 新 语言 的 最 初 的 洪荒 之 力 来 自 于 对 超级 复杂 的 C++11 特 性 的 歇 捧 报 告 的 
部 祝 ， 最 终 的 目标 是 设计 网 络 和 多 核 时 代 的 C 语 言 。 到 2008 年 中 期 ， 语 言 的 大 部 分 特性 设计 
已 经 完成 ， 并 开始 着 手 实现 编译 器 和 运行 时 ， 大 约 在 这 一 年 Russ Cox 作 为 主力 开发 者 加 入 。 
到 了 2010 年 ，Go 语 言 已 经 逐步 趋 于 稳定 ， 并 在 9 月 正式 发 布 Go 语 言 并 开源 了 代码 。 
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Go 语言 很 多 时 候 被 描述 为 “类 C 语 言 "， 或 者 是 “21 世 纪 的 C 语 言 "。 从 各 种 角度 看 ，Go 语 言 确 实 
是 从 C 语 言 继 承 了 相似 的 表达 式 语法 、 控 制 流 结构 、 基 础 数据 类 型 、 调 用 参数 传 值 、 指 针 等 诸 
多 编程 思想 ， 还 有 彻底 继承 和 发 扬 了 C 语 言 简单 直接 的 暴力 编程 哲学 等 。 下 面 是 《Go 语言 圣 

经 》 中 给 出 的 Go 语言 的 基因 图 谱 ， 我 们 可 以 从 中 看 到 有 哪些 编程 语言 对 Go 语言 产生 了 影响 。 


ALGOL 60 
(Backus et al., 1960) 


| 


Pascal 
(Wirth, 1970) 
C 
(Ritchie, 1972) 
CSP 
(Hoare, 1978) Modula-2 
i (Wirth, 1980) 
Squeak 
(Cardelli & Pike, 1985) Oberon 
t (Wirth & Gutknecht, 
1986) 
j cdi ioo Object Oberon 
4 (Móssenbóck, Templ 
& Griesemer, 1990) 
Alef Oberon-2 "d 
(Winterbottom, 1992) (Wirth & Móssenbóck, 
1991) 





Go 
(Griesemer, Pike & Thompson, 2009) 


首先 看 基因 图 谱 的 左边 一 支 。 可 以 明确 看 出 Go 语言 的 并 发 特性 是 由 贝尔 实验 室 的 Hoare 于 
1978 年 发 布 的 CSP 理 论 演化 而 来 。 其 后 ，CSP 并 发 模型 在 Squeak/NewSqueak 和 Alef 等 编程 
语言 中 逐步 完善 并 走向 实际 应 用 ， 最 终 这 些 设计 经 验 被 消化 并 吸收 到 了 Go 语言 中 。 业 界 比较 
熟悉 的 Erlang 编 程 语言 的 并 发 编程 模型 也 是 CSP 理 论 的 另 一 种 实现 。 


再 看 基因 图 谱 的 中 间 一 支 。 中 间 一 支 主要 包含 了 Go 语言 中 面向 对 象 和 和 包 特 性 的 演化 历程 。Go 
语言 中 包 和 接口 以 及 面向 对 象 等 特性 则 继承 自 Niklaus Wirth 所 设计 的 Pascal 语 言 以 及 其 后 所 的 
衍生 的 相关 编程 语言 。 其 中 包 的 概念 、 包 的 导入 和 声明 等 语法 主要 来 自 于 Modula-2 编 程 语 


vQ 


一 一 


言 ， 面向 对 象 特 性 所 提供 的 方法 的 声明 语法 等 则 来 自 于 Oberon 编 程 语言 。 最 终 Go 语 言 演化 出 


了 自己 特有 的 支持 鸭子 面向 对 象 模型 的 隐 式 接口 等 诸多 特性 。 

最 后 是 基因 图 谱 的 右边 一 支 ， 这 是 对 C 语 言 的 致敬 。GO 语 言 是 对 C 语 言 最 彻底 的 一 次 扬弃 ， 不 
仅仅 是 语法 和 C 语 言 有 着 很 多 差异 ， 最 重要 的 是 舍弃 了 Ci 语言 中 灵活 但 是 危险 的 指针 运算 。 而 
且 ，Go 语 言 还 重新 设计 了 C 语 言 中 部 分 不 太 合 理 运 算 符 的 优先 级 ， 并 在 很 多 细微 的 地 方 都 做 

了 必要 的 打磨 和 改变 。 当 然 ，C 语 言 中 少 即 是 多 、 简 单 直接 的 暴力 编程 哲学 则 被 Go 语言 更 彻 

底 地 发 扬 光 大 了 (Go 语言 居然 只 有 25 个 关键 字 ，sepc 语 言 规范 还 不 到 50 页 )) 。 


Go 语言 其 它 的 一 些 特性 零散 地 来 自 于 其 他 一 些 编程 语言 ; 比如 jota 语 法 是 从 APL 语 言 借 鉴 ， 词 
法 作用 域 与 吝 套 函数 等 特性 来 自 于 Scheme 语 言 (和 其 他 很 多 编程 语言 ) 。Go 语 言 中 也 有 很 
多 自己 发 明 创新 的 设计 。 比 如 Go 语言 的 切片 为 轻 量 级 动态 数组 提供 了 有 效 的 随机 存 取 的 性 

能 ， 这 可 能 会 让 人 联想 到 链表 的 底层 的 共享 机 制 。 还 有 Go 语言 新 发 明 的 defer 语 名 (Ken 发 
明 ) 也 是 神 来 之 笔 。 


来 自 贝 尔 实验 室 特有 基因 


作为 Go 语言 标志 性 的 并 发 编程 特性 则 来 自 于 贝尔 实验 室 的 Tony Hoare 于 1978 年 发 表 鲜 为 外 界 
所 知 的 关于 并 发 研究 的 基础 文献 : 顺序 通信 进程 ( communicating sequential processes ， 
缩写 为 CSP) 。 在 最 初 的 CSP 论 文中 ， 程 序 只 是 一 组 没有 中 间 共 享 状态 的 平行 运行 的 处 理 过 
程 ， 它 们 之 间 使 用 管道 进行 通信 和 控制 同步 。Tony Hoare 的 CSP 并 发 模型 只 是 一 个 用 于 描述 
并 发 性 基本 概念 的 描述 语言 ， 它 并 不 是 一 个 可 以 编写 可 执行 程序 的 通用 编程 语言 。 


CSP 并 发 模型 最 经 典 的 实际 应 用 是 来 自爱 立信 发 明 的 Erlang 编 程 语言 。 不 过 在 Erlang 将 CSP 理 
论 作为 并 发 编程 模型 的 同时 ， 同 样 来 自 贝 尔 实验 室 的 Rob Pike 以 及 其 同事 也 在 不 断 尝试 将 
CSP 并 发 模型 引入 当时 的 新 发 明 的 编程 语言 中 。 他 们 第 一 次 尝试 引入 CSP 并 发 特性 的 编程 语 
言 叫 Squeak (老鼠 的 叫 声 ) ， 是 一 个 用 于 提供 鼠标 和 键盘 事件 处 理 的 编程 语言 ， 在 这 个 语言 
中 管道 是 静态 创建 的 。 然 后 是 改进 版 的 Newsqueak 语 言 (新 版 老鼠 的 叫 声 ) ， 新 提供 了 类 似 
C 语 言语 句 和 表达 式 的 语法 ， 还 有 类 似 Pascal 语 言 的 推导 语法 。Newsqueak 是 一 个 带 垃圾 回 
收 的 纯 函 数 式 语 言 ， 它 再 次 针对 键盘 、 鼠 标 和 窗口 事件 管理 。 但 是 在 Newsqueak 语 言 中 管道 
已 经 是 动态 创建 的 ， 管 道 属于 第 一 类 值 、 可 以 保存 到 变量 中 。 然 后 是 Alef 编 程 语言 (Alef 也 是 
C 语 言 之 父 Ritchie 比 较 喜 爱 的 编程 语言 ) ，Alef 语 言 试图 将 Newsqueak 语 言 改造 为 系统 编程 语 
言 ， 但 是 因为 缺少 垃圾 回收 机 制 而 导致 并 发 编程 很 痛苦 〈 这 也 是 继承 C 语 言 手 工 管理 内 存 的 代 
fr) 。 在 Aelf 语 言 之 后 还 有 一 个 叫 Limbo 的 编程 语言 《地狱 的 意思 ) ， 这 是 一 个 运行 在 虚拟 机 
中 的 脚本 语言 。Limbo 语 言 是 Go 语言 最 接近 的 祖先 ， 它 和 Go 语言 有 着 最 接近 的 语法 。 到 设计 
Go 语言 时 ，Rob Pike 在 CSP 并 发 编程 模型 的 实践 道路 上 已 经 积累 了 几 十 年 的 经 验 ， 关 于 Go 语 
言 并 发 编程 的 特性 完全 是 信 手 牛 来 ， 新 编程 语言 的 到 来 也 是 水 到 渠 成 了 。 


可 以 从 Go 语言 库 早期 代码 库 日 志 可 以 看 出 最 直接 的 演化 历程 (Git 用 git log --before-(2008- 


03-03) --reverse 命令 查看 ) 


:\go\go-tip>hg log -r 0:4 

hangeset: 0:f6182e5abf5e 
Brian Kernighan <bwk> 
Tue Jul 18 19:05:45 1972 -0500 
hello, world 


1:b66d0bf8da3e 

Brian Kernighan <bwk> 

Sun Jan 20 01:02:03 1974 -0400 
convert to C 


2:ac3363d7e788 

Brian Kernighan «research!bwk- 
Fri Apr 01 02:02:04 1988 -0500 
convert to Draft-Proposed ANSI C 


3:172d32922e72 

Brian Kernighan «bwkQresearch.att.com- 
Fri Apr 01 02:03:04 1988 -0500 
last-minute fix: convert to ANSI C 


4:4e9a5b095532 

Robert Griesemer «gri(golang.org-» 

Sun Mar 02 20:47:34 2008 -0800 
summary: Go spec starting point. 





: \go\go-tip> 


从 早期 提交 日 志 中 也 可 以 看 出 ，Go 语 言 是 从 Ken Thompson £ 8] 85 B3& $ ` Dennis M. Ritchie 
发 明 的 C 语 言 逐 步 演化 过 来 的 ， 它 首先 是 C 语 言 家 族 的 成 员 ， 因 此 很 多 人 将 Go 语言 称 为 21 世 纪 
的 C 语 言 9 


下 面 是 Go 语言 中 来 自 贝 尔 实验 室 特 有 并 发 编程 基因 的 演化 过 程 : 


1969 1972 1989 1993 1995 2009 
B C Newsqueak Alef Limbo Go 


纵 观 整个 贝尔 实验 室 的 编程 语言 的 发 展 进程 ， 从 B 语 言 、C 语 言 、Newsqueak、Alef、Limbo 
语言 一 路 走 来 ，Go 语 言 继承 了 来 着 贝尔 实验 室 的 半 个 世纪 的 软件 设计 基因 ， 终 于 完成 了 C 语 
言 革新 的 使 命 。 纵 观 这 几 年 来 的 发 展 趋势 ，Go 语 言 已 经 成 为 云 计 算 、 云 存储 时 代 最 重要 的 基 


础 编程 语 言 9 


你 好 , 世界 


按照 惯例 ， 介 绍 所 有 编程 语言 的 第 一 个 程序 都 是 “Hello, World'”。 虽 然 本 教 假设 读者 已 经 了 解 
了 Go 语言 ， 但 是 我 们 还 是 不 想 打 破 这 个 惯例 (因为 这 个 传统 正 是 从 Go 语言 的 前 莫 C 语 言传 承 
而 来 的 ) 。 不 过 ，Go 语 言 的 这 个 程序 输出 的 是 中 文 “你 好 , 世界 |”。 


package main 
import "fmt" 


func main() { 
fmt .Println(" 你 好 ， 世 界 1") 
} 


将 以 上 代码 保存 到 hello.go 文件 中 。 因 为 代码 中 有 非 ASCII 的 中 文字 符 ， 我 们 需要 将 文件 的 
编码 显 式 指定 为 无 BOM 的 UTF8 编 码 格 式 ( 源 文件 采用 UTF8 编 码 是 Go 语言 规范 所 要 求 的 ) 。 
然后 进入 命令 行 并 切换 到 hello.go 文件 所 在 的 目录 。 目 前 我 们 可 以 将 Go 语言 当 作 脚 本 语言 ， 
在 命令 行 中 直接 输入 go run hello.go 来 运行 程序 。 如 果 一 切 正 常 的 话 。 应 该 可 以 在 命令 行 看 
到 输出 "你 好 , 世界 I" 的 结果 。 


现在 ， 让 我 们 简单 介绍 一 下 程序 。 所 有 的 Go 程序 ， 都 是 由 最 基本 的 函数 和 变量 构成 ， 函 数 和 
变量 被 组 织 到 一 个 个 单独 的 Go 源 文件 中 ， 这 些 源 文件 再 按照 作者 的 意图 组 织 成 合适 的 
package， 最 终 这 些 package 再 有 机 地 组 成 一 个 完整 的 Go 语言 程序 。 其 中 ， 函 数 用 于 包含 一 系 
列 的 语句 (指明 要 执行 的 操作 序列 )， 以 及 执行 操作 时 存放 数据 的 变量 。 我 们 这 个 程序 中 函数 的 
名 字 是 main 。 虽 然 Go 语 言 中 ， 函 数 的 名 字 没 有 太 多 的 限制 ， 但 是 main 包 中 的 main 函 数 默 认 是 
每 一 个 可 执行 程序 的 入 口 。 而 package 则 用 于 包装 和 组 织 相 关 的 函数 、 变 量 和 常量 。 在 使 用 一 
个 package 之 前 ， 我 们 需要 使 用 import 语 句 导入 包 。 例 如 ， 我 们 这 个 程序 中 导入 了 fmt 包 (fmt 
是 format 单 词 的 缩写 ， 表 示 格式 化 相关 的 包 ) ^ RERNI TAE RU mt, P Printi i < 


而 双 引 号 包含 的 “你 好 , 世界 ! 则 是 Go 语言 的 字符 串 面 值 常 量 。 和 C 语 言 中 的 字符 串 不 同 ，Go 语 
言 中 的 字符 囊 内 容 是 不 可 变更 的 。 在 以 字符 串 作 为 参数 传递 给 fmt.Printn 函数 时 ， 字 符 串 的 内 
容 并 没有 被 复制 一 一 传递 的 仅仅 是 字符 囊 的 地 址 和 长 度 (字符 串 的 结构 

在 reflect.StringHeader PEL) 。 在 Go 语言 中 ， 函 数 参 数 都 是 以 复制 的 方式 (不 支持 以 引用 
的 方式 ) 传 递 (比较 特殊 的 是 ，Go 语 言 闭 包 函数 对 外 部 变量 是 以 引用 的 方式 使 用 ) 。 


1.2. Hello, World 的 革命 


在 创世纪 章节 中 我 们 简单 介绍 了 Go 语言 的 演化 基因 族谱 ， 对 其 中 来 自 于 贝尔 实验 室 的 特有 并 
发 编程 基因 做 了 重点 介绍 ， 最 后 引出 了 Go 语言 版 的 “Hello, World” 程 序 。 其 实 “Hello, World" 程 
序 是 展示 各 种 语言 特性 的 最 好 的 例子 ， 是 通 向 该 语言 的 一 个 窗口 。 这 一 节 我 们 将 沿 着 各 个 编 
程 语言 演化 的 时 间 轴 ， 简 单 回顾 下 “Hello, World" 程 序 是 如 何 逐 步 演化 到 目前 的 Go 语言 形式 、 
最 终 完 成 它 的 革命 使 命 的 。 
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Bié $ -Ken Thompson, 1972 


首先 是 B 语 言 ，B 语 言 是 Go 语言 之 父 贝 尔 实验 室 的 Ken Thompson 早 年 间 开 发 的 一 种 通用 的 程 
序 设计 语言 ， 设 计 目 的 是 为 了 用 于 辅助 UNIX 系 统 的 开发 。 但 是 因为 B 语 言 缺 乏 灵 活 的 类 型 系 
统 导 致使 用 比较 困难 。 后 来 ，Ken Thompson 的 同事 Dennis Ritchie 以 B 语 言 为 基础 开发 出 了 C 
语言 ，C 语 言 提 供 了 丰富 的 类 型 ， 极 大 地 增加 了 语言 的 表达 能 力 。 到 目前 为 止 它 依然 是 世界 上 
最 常用 的 程序 语言 之 一 。 而 B 语 言 自从 被 它 取代 之 后 ， 则 就 只 存在 于 各 种 文献 之 中 ， 成 为 了 历 
$e 


目前 见 到 的 B 语 言 版 本 的 “Hello World”， 一 般 认为 是 来 自 于 Brian W. Kernighan 编 写 的 B 语 言 入 
门 教程 (Go 核心 代码 库 中 的 第 一 个 提交 者 名 字 正 是 Brian W. Kernighan) ， 程 序 如 下 : 


main() { 
extrn a, b, c; 
putchar(a); putchar(b); putchar(c); 
putchar('!*n'); 


'o, w'; 


} 
a 'hell'; 
b 
c 'orld'; 


由 于 B 语 言 缺 乏 灵 活 的 数据 类 型 ， 只 能 分 别 以 a/b/c 全 局 变量 来 定义 要 输出 的 内 容 ， 并 且 每 个 
变量 的 长 度 必须 对 齐 到 了 4 个 字 节 (有 一 种 写 汇 编 语言 的 感觉 ) 。 然 后 通过 多 次 调 
用 putchar 函数 输出 字符 ， 最 后 的 n 表示 输出 一 个 换行 的 意思 。 


总 体 来 说 ，B 语 言 简单 ， 功 能 也 比较 简陋 。 


Cié -Dennis Ritchie, 1974 ~ 1989 


C $ X h Dennis Ritchie 在 B 语 言 的 基础 上 改进 而 来 ， 它 增加 了 丰富 的 数据 类 型 ， 并 最 终 实现 
了 用 它 重 写 UNIX 的 伟大 目标 。C 语 言 可 以 说 是 现代 IT 行业 最 重要 的 软件 基石 ， 目 前 主流 的 操 

作 系 统 几乎 全 部 是 由 C 语 言 开 发 的 ， 许 多 基础 系统 软件 也 是 C 语 言 开 发 的 。C 系 家 族 的 编程 语 

言 占据 统治 地 位 达 几 十 年 之 久 ， 半 个 多 世纪 以 来 依然 充满 活力 。 


在 Brian W. Kernighan 于 1974 年 左右 编写 的 C 语 言 入 门 教程 中 ， 出 现 了 第 一 个 C 语 言 版 本 
的 “Hello World" 程 序 。 这 给 后 来 大 部 分 编程 语言 教程 都 以 "Hello World” 为 第 一 个 程序 提供 了 惯 
例 。 第 一 个 C 语 言 版 本 的 “Hello World" 程 序 如 下 : 


main() 


{ 
printf("hello, world"); 


} 


关于 这 个 程序 ， 有 几 点 需要 说 明 的 : 首先 是 main 函数 因为 没有 明确 返回 值 类 型 ， 默 认 返 
回 int 类 型 ; 其 次 printf HARUT ERGA RA A EPT ARA ; 最 后 main 没有 明确 返 
回 语句 ， 但 默认 返回 0 值 。 在 这 个 程序 出 现时 ，C 语 言 还 远 未 标准 化 ， 我 们 看 到 的 是 上 十 时 代 
的 C 语 言语 法 : 函数 不 用 写 返回 值 ， 函 数 参 数 也 可 以 忽略 ， 使 用 printf 时 不 需要 包含 头 文件 


A 


Xo 


这 个 例子 同样 出 现在 了 1978 年 出 版 的 《C 程 序 设 计 语 言 》 第 一 版 中 ， 作 者 正 是 Brian W. 
Kernighan 和 Dennis M. Ritchie (简称 K&R) 。 书 中 的 “Hello World" 末 尾 增加 了 一 个 换行 输 
出 : 


main() 


t 
printf("hello, world*n"); 


} 


这 个 例子 在 字符 串 末 尾 增 加 了 一 个 换行 ，C 语 言 的 Nn 换行 比 B 语 言 的 n 换行 看 起 来 要 简 
洁 了 一 些 。 


在 K&R 的 教程 面世 10 年 之 后 的 1988 年 ，《C 程 序 设计 语言 》 第 二 版 终于 出 版 了 。 此 时 ANSIC 
语言 的 标准 化 草案 已 经 初步 完成 ， 但 正式 版 本 的 文档 尚未 发 布 。 不 过 书 中 的 “Hello World” 程 序 
根据 新 的 规范 增加 了 #include <stdio.h> 头 文件 包含 语句 ， 用 于 包含 printf 函数 的 声明 (新 
的 C89 标 准 中 ， 仅 仅 是 针对 printf 函数 而 言 ， 依 然 可 以 不 用 声明 函数 而 直接 使 用 ) o 


include <stdio.h> 


main() 


{ 
printf("hello, worldNin"); 


} 


然后 到 了 1989 年 ，ANSI C 语 言 第 一 个 国际 标准 发 布 ， 一 般 被 称 为 C89。C89 是 流行 最 广泛 的 
一 个 C 语 言 标准 ， 目 前 依然 被 大 量 使 用 。《C 程 序 设 计 语 言 》 第 二 版 的 也 再 次 印刷 新 版 本 ， 并 
针对 新 发 布 的 C89 规 范 建议 ， 给 main 函数 的 参数 增加 了 void 输入 参数 说 明 ， 表 示 没 有 输入 
参数 的 意思 。 


#include <stdio.h> 


main(void) 
{ 
printf("hello, worldNin"); 


} 


至 此 ，C 语 言 本 身 的 进化 基本 完成 。 后 面 的 C92/C99/C11 都 只 是 针对 一 些 语言 细节 做 了 完善 。 
因为 各 种 历史 因素 ，C89 依 然 是 使 用 最 广泛 的 标准 。 


Newsqueak - Rob Pike, 1989 


Newsqueak 是 Rob Pike 发 明 的 老鼠 语言 的 第 二 代 ， 是 他 用 于 实践 CSP 并 发 编程 模型 的 战场 。 
Newsqueak 有 是 新 的 squeak 语 言 的 意思 ， 其 中 squeak 是 老鼠 叶 叶 咏 的 叫 声 ， 也 可 以 看 作 是 类 似 
筷 标点 击 的 声音 。Squeak 是 一 个 提供 鼠标 和 键盘 事件 处 理 的 编程 语言 ，Squeak 语 言 的 管道 是 
静态 创建 的 。 改 进 版 的 Newsqueak 语 言 则 提供 了 类 似 C 语 言语 句 和 表达 式 的 语法 和 类 似 
Pascal 语 言 的 推导 语法 。Newsqueak 是 一 个 带 自动 垃圾 回收 的 纯 函 数 式 语言 ， 它 再 次 针对 键 
盘 、 和 鼠标 和 窗口 事件 管理 。 但 是 在 Newsqueak 语 言 中 管道 是 动态 创建 的 ， 属 于 第 一 类 值 ， 
此 可 以 保存 到 变量 中 。 


Newsqueak 类 似 脚本 语言 ， 内 置 了 一 个 print 元 数 ， 它 的 “Hello World" 程 序 看 不 出 什么 特 
色 : 


print("Hello,", "World", "\n"); 


从 上 面 的 程序 中 ， 除 了 猜测 print 函数 可 以 支持 多 个 参数 外 ， 我 们 很 难看 到 Newsqueak 语 言 
相关 的 特性 。 由 于 Newsqueak 语 言 和 Go 语言 相关 的 特性 主要 是 并 发 和 管道 。 因 此 ， 我 们 这 里 
通过 一 个 并 发 版 本 的 "素数 得 "算法 来 略 寅 Newsqueak 语 言 的 特性 。" 素 数 算 "的 原理 如 图 : 
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Newsqueak 语 言 并 发 版 本 的 “素数 得? 程序 如 下 : 


1.2. Hello, World 的 革命 


15 


// € 人 出 从 2 开始 的 自然 数 序列 





counter := prog(c:chan of int) { 
i := 2; 
for(;;) t 
c <-= i++; 
} 
}; 
// 针对 1isten 管 道 获取 的 数列 ， 过 prime 倍 数 的 数 
// 新 的 序列 输出 到 send 管 道 
filter := prog(prime:int, listen, send:chan of int) { 
Nt 
for(;;) { 


if((i = <-listen)%prime) { 


send <-= i; 








} 
} 
HN 
p 3t 
// 8 
sieve := prog() of chan of int { 
c :- mk(chan of int); 
begin counter(c); 
prime :- mk(chan of int); 
begin prog()i 
p:int; 
newc:chan of int; 
for(;;)t 
prime «-- p -«- c; 
newc - mk(); 
begin filter(p, c, newc); 
c - newc; 
} 
}(); 
become prime; 
HN 
// À 
prime :- sieve(); 


其 中 counter 函数 用 ATATA 首 输出 原始 的 自 然 数 序列 Í^ d 每 个 filter E xp SN | 对 应 每 一 个 新 
的 素数 过 滤 管 道 ， 这 些 素数 过 滤 管 道 根 据 当 前 的 素数 筛子 将 输入 管道 流入 的 数列 筛选 后 重新 
输出 到 输出 管道 ° mk(chan of int) 用 于 创建 管 道 ， 类 似 Go 语 言 的 make(chan int) i 

4] ; begin filter(p, c, newc) 关键 字 局 动 素数 得 的 并 发 体 ， 类 似 Go 语 言 的 go filter(p, c, 
newc ) 语句 i become 用 于 返回 函数 结果 ， 类 似 return %4 ° 


Newsqueak 语 言 中 并 发 体 和 管道 的 语法 和 Go 语言 已 经 比较 接近 了 ， 后 置 的 类 型 声明 和 Go 语言 
的 语法 也 很 相似 


Alef - Phil Winterbottom, 1993 


在 Go 语言 出 现 之 前 ，Alef 语 言 是 作者 心中 比较 完美 的 并 发 语言 ，Alef 语 法 和 运行 时 基本 是 无 缝 
兼容 C 语 言 。Alef 语 言 中 的 对 线程 和 进程 的 并 发 体 都 提供 了 支持 ， 其 中 proc receive(c) 用 于 
启动 一 个 进程 task receive(c) 用 于 启动 一 个 线程 ， 它 们 之 间 通 过 管道 c 进行 通讯 。 不 过 
由 于 Alef 缺 乏 内 存 自 动 回收 机 制 ， 导 致 并 发 体 的 内 存 资源 管理 异常 复杂 。 而 且 Alef 语 言 只 在 
Plan9 系 统 中 提供 过 短暂 的 支持 ， 其 它 操作 系统 并 没有 实际 可 以 运行 的 Alef 开 发 环境 。 而 且 
Alef 语 言 只 有 《Alef 语 言 规范 》 和 《Alef 编 程 向 导 》 两 个 公开 的 文档 ， 因 此 在 贝尔 实验 室 之 外 
关于 Alef 语 言 的 讨论 并 不 多 。 


由 于 Alef 语 言 同时 支持 进程 和 线程 并 发 体 ， 而 且 在 并 发 体 中 可 以 再 次 启动 更 多 的 并 发 体 ， 导 致 
了 Alef 的 并 发 状态 会 异常 复杂 。 同 时 Alef 没 有 自动 垃圾 回收 机 制 (Alef 因 为 保留 的 C 语 言 灵 活 的 
指针 特性 ， 也 导致 了 自动 垃圾 回收 机 制 实现 比较 困难 ) ， 各 种 资源 充斥 于 不 同 的 线程 和 进程 
之 间 ， 导 致 并 发 体 的 内 存 资源 管理 异常 复杂 。Alef 语 言 全 部 继承 了 Ci 语言 的 语法 ， 可 以 认为 是 
增强 了 并 发 语法 的 C 语 言 。 下 图 是 Alef 语 言 文档 中 展示 的 一 个 可 能 的 并 发 体 状 态 : 







Process 2 








Process 3 


Alef 语 言 并 发 版 本 的 “Hello World” 程 序 如 下 : 


include «alef.h» 


void receive(chan(byte*) c) { 
byte *s; 
S = <- C} 
print("%s\n", s); 
terminate(nil); 


} 


void main(void) { 
chan(byte*) c; 
alloc c; 
proc receive(c); 
task receive(c); 
c <- = "hello proc or task"; 
c <- = "hello proc or task"; 
print("doneNn"); 
terminate(nil); 


程序 开头 的 sinclude «alef.n» 语句 用 于 包含 Alef 语 言 的 运行 时 库 。 receive 是 一 个 普通 函 

数 ， 程 序 中 用 作 每 个 并 发 体 的 入 口 函 数 main 函数 中 的 alloc c 语句 先 创 建 一 

个 chan(byte*) 类 型 的 管道 ， 类 似 Go 语 言 的 make(chan []byte) 语句 ; 然后 分 别 启 动 以 进程 和 
线程 的 方式 启动 receive AA: 启动 并 发 体 之 后 ，main 函数 向 c 管道 发 送 了 两 个 字符 串 数 

据 ; 而 进程 和 线程 状态 运行 的 receive 函数 会 以 不 确定 的 顺序 先后 从 管道 收 到 数据 后 ， 然 后 
分 别 打印 字符 串 ; 最 后 每 个 并 发 体 都 通过 调用 terminate(nil) 来 结束 自 己 。 


Alef 的 语法 和 C 语 言 基 本 保持 一 致 ， 可 以 认为 它 是 在 C 语 言 的 语法 基础 上 增加 了 并 发 编程 相关 
的 特性 ， 可 以 看 作 是 另 一 个 维度 的 C++ 语言 。 


Limbo - Sean Dorward, Phil Winterbottom, Rob 
Pike, 1995 


Limbo (地 狱 ) 是 用 于 开发 运行 在 小 型 计算 机 上 的 分 布 式 应 用 的 编程 语言 ， 它 支持 模块 化 编 
程 ， 编 译 期 和 运行 时 的 强 类 型 检查 ， 进 程 内 基于 具有 类 型 的 通信 管道 ， 原 子 性 垃圾 收集 和 简 
单 的 抽象 数据 类 型 。Limbo 被 设计 为 : 即便 是 在 没有 硬件 内 存 保 护 的 小 型 设备 上 ， 也 能 安全 运 
行 。Limbo 语 言 主要 运行 在 Inferno 系 统 之 上 。 


Limbo 语 言 版 本 的 “Hello World” 程 序 如 下 : 


implement Hello; 


include "sys.m"; sys: Sys; 
include "draw.m"; 


Hello: module 
1 


init: fn(ctxt: ref Draw-»-Context, args: list of string); 


HN 


init(ctxt: ref Draw-»Context, args: list of string) 


{ 
sys = load Sys Sys->PATH; 
sys->print("hello, world\n"); 


从 这 个 版 本 的 “Hello World" 程 序 中 ， 我 们 已 经 可 以 发 现 很 多 Go 语言 特性 的 维 形 。 第 一 

aJ implement Hello; 基本 对 应 Go 语言 的 package Hello E P5 IIE 6] o REK include "sys.m"; 
sys: Sys; 和 include "draw.m"; 语句 用 于 导入 其 它 的 模块 ， 类 似 Go 语 言 的 import 

"sys" 和 import "draw" 语句 。 然 后 Hello 包 模块 还 提供 了 模块 初始 化 函数 init ， 并 且 有 函数 的 
参数 的 类 型 也 是 后 置 的 ， 不 过 Go 语言 的 初始 化 函数 是 没有 参数 的 。 


Go 语言 -2007~2009 


贝尔 实验 室 后 来 经 历 了 多 次 动荡 ， 包 括 Ken Thompson 在 内 的 Plan9 项 目 原 班 人 马 最 终 加 入 了 
Google 公 司 。 在 发 明 Limbo 等 前 华语 言 诞生 10 多 年 之 后 ， 在 2007 年 底 ，Go 语 言 三 个 最 初 的 作 
者 因为 偶然 的 因素 聚集 到 一 起 批斗 C++ (传说 是 C++ 语 言 的 布道 师 在 Google 公 司 到 处 鼓吹 的 
C++11 各 种 牛 逼 特性 彻底 惹恼 了 他 们 ) ， 他 们 终于 抽出 了 20% 的 自由 时 间 创 造 了 Go 语言 。 最 
初 的 Go 语言 规范 从 2008 年 3 月 开始 编写 ， 最 初 的 Go 程序 也 是 直接 编译 到 C 语 言 然后 再 二 次 编 
译 为 机 器 码 。 到 了 2008 年 5 月 ，Google 公 司 的 领导 们 终于 发 现 了 Go 语言 的 巨大 潜力 ， 从 而 开 
始 全 力 支 持 这 个 项 目 (Google 的 创始 人 其 至 还 贡献 了 func 关键 字 ) ， 让 他 们 可 以 将 全 部 工作 
时 间 投 入 到 Go 语言 的 设计 和 开发 中 。 在 Go 语言 规范 初版 完成 之 后 ，Go 语 言 的 编译 器 终于 可 
以 直接 生成 机 器 码 了 。 


hello.go - 2008 年 6 月 


package main 


func main() int { 
print "hello, worldNn"; 
return 0; 


这 是 初期 GO 语言 程序 正式 开始 测试 的 版 本 。 其 中 内 置 的 用 于 调试 的 print 语句 已 经 存在 ， 不 
过 是 以 命令 的 方式 使 用 。 入 口 min 函数 还 和 C 语 言 中 的 main 函数 一 样 返回 int 类 型 的 值 ， 
且 需 要 return 显 式 地 返回 值 。 每 个 语句 末尾 的 分 号 也 还 存在 。 


hello.go - 2008 年 6 月 27 日 


package main 
func main() { 


print "hello, world*n"; 
} 


AU E main 已 经 去 掉 了 返回 值 ， 程 序 默认 通过 隐 式 调用 exit(o) 来 返回 。Go 语 言 朝 着 简 
单 的 方向 逐步 进化 。 


hello.go - 2008 年 8 月 11 日 


package main 
func main() { 


print("hello, worldNn"); 
} 


用 于 调试 的 内 置 的 print 由 开始 的 命令 改 为 普通 的 内 置 函 数 ， 使 得 语法 更 加 简单 一 致 


hello.go - 2008 年 10 月 24 日 


package main 
import "fmt" 
func main() { 


fmt.printf("hello, worldin"); 
} 


作为 C 语 言 中 招牌 的 printf 格式 化 函数 已 经 移植 了 到 了 Go 语言 中 ， 函 数 放 在 fmt 包 中 
( fmt 是 格式 化 单词 format 的 缩写 ) 。 不 过 printf 函数 名 的 开头 字母 依然 是 小 写字 母 ， 采 
用 大 写字 母 表示 导出 的 特性 还 没有 出 现 。 


hello.go - 2009 年 1 月 15 日 


package main 
import "fmt" 


func main() { 
fmt.Printf("hello, world^n"); 
} 


Go 语言 开始 采用 是 否 大 小 写 首 字母 来 区 分 符号 是 否 可 以 被 导出 。 大 写字 母 开 头 表 示 导 出 的 公 
共 符 号 ， 小 写字 母 开头 表示 包 内 部 的 私有 符号 。 国 内 用 户 需 要 注意 的 是 ， 汉 字 中 没有 大 小 写 
字母 的 概念 ， 因 此 以 汉字 开头 的 符号 目前 是 无 法 导出 的 (针对 问题 中 国 用 户 已 经 给 出 相关 建 
议 ， 等 G02 之 后 或 许 会 调整 对 汉字 的 导出 规则 ) o 


hello.go - 2009 年 12 月 11 日 


package main 
import "fmt" 


func main() { 
fmt.Printf("hello, worldNn") 
} 


Go 语言 终于 移 除 了 语句 末尾 的 分 号 。 这 是 Go 语言 在 2009 年 11 月 10 号 正式 开源 之 后 第 一 个 比 
较 重 要 的 语法 改进 。 从 1978 年 C 语 言 教程 第 一 版 引入 的 分 号 分 割 的 规则 到 现在 ，Go 语 言 的 作 
者 们 花 了 整整 32 年 终于 移 除了 语句 末尾 的 分 号 。 在 这 32 年 的 演化 的 过 程 中 必然 充满 了 各 种 八 
卦 故事 ， 我 想 这 一 定 是 GO 语言 设计 者 深思 熟 虑 的 结果 (现在 Swift 等 新 的 语言 也 是 默认 忽略 分 
号 的 ， 可 见 分 号 确实 并 不 是 那么 的 重要 ) o 


CGO 版 本 


Go 语言 开源 初期 就 支持 通过 CGO 和 C 语 言 保持 交互 。CGO 通 过 导入 一 个 虚拟 的 "c" 包 来 访问 
C 语 言 中 的 函数 。 下 面 是 CGO 版 本 的 “Hello World" 程 序 : 


package main 


// &include <stdio.h> 
// 4include «stdlib.h» 
Import ey 


import "unsafe" 


func main() { 
msg := C.CString("Hello, World!\n") 
defer C.free(unsafe.Pointer(msg)) 


C.fputs(msg, C.stdout) 


先 通过 C.CString 函数 将 Go 语言 字符 串 转 为 C 语 言 字 符 串 ， 然 后 调用 C 语 言 的 C.fputs 函数 向 
标准 输出 窗口 打印 转换 后 的 C 字 符 串 。 defer 延迟 语句 保证 程序 返回 前 通过 C.free 释放 分 配 
的 C 字 符 串 。 需 要 注意 的 是 , CGO 不 支持 C 语 言 中 的 可 变 参 数 函 数 〈 因 为 Go 语言 每 次 函数 调用 
的 栈 帧 大 小 是 国定 的 ， 而 且 Go 语 言 中 可 变 参 数 语法 只 是 切片 的 一 个 语法 糖 而 已 ) ， 因 此 在 Go 
语言 中 是 无 法 通过 CGO 访问 C 语 言 的 printf 等 可 变 参 数 函 数 的 。 同 时 ，CGO 只 能 访问 C 语 言 
的 函数 、 变 量 和 简单 的 宏 定 义 常 量 ，CGO 并 不 支持 访问 C++ 语言 的 符号 《C++ 和 C 语 言 符 号 的 
名 字 修 饰 规则 不 同 ，CGO 采 用 C 语 言 的 名 字 修 饰 规则 ) 。 


其 实 CGO 不 仅仅 用 于 在 Go 语言 中 调用 C 语 言 函 数 ， 还 可 以 用 于 导出 Go 语言 函数 给 C 语 言 函 数 
调用 。 在 用 Go 语言 编写 生成 C 语 言 的 静 、 动 态 库 时 ， 也 可 以 用 CGO 导 出 对 应 的 接口 函数 。 正 
是 CGO 的 存在 ， 才 保证 了 Go 语言 和 C 语 言 资 源 的 双向 互通 ， 同 时 保证 了 Go 语言 可 以 继承 C 语 
言 已 有 的 庞大 的 软件 资产 。 


SWIG 版 本 


Go 语言 开源 初期 除了 支持 通过 CGO 访 问 C 语 言 资源 外 ， 还 支持 通过 SWIG 访 问 C/C++ 接口 。 
SWIG 是 从 2010 年 10 月 04 日 发 布 的 SWIG-2.0.1 版 本 开始 正式 支持 Go 语言 的 。 可 以 将 SWIG 看 
作 一 个 高 级 的 CGO 代码 自动 生成 器 ， 同 时 通过 生成 C 语 言 桥接 代码 增加 了 对 C++ 类 的 支持 。 下 
面 是 SWIG 版 本 的 "Hello World" 程 序 : 


首先 是 创建 一 个 hello.cc 文件 * 3 dA SayHello 函数 用 于 打印 (这 里 的 SayHello HARA 
C++ 的 名 字 修饰 规则 ) : 

include <iostream> 

void SayHello() 1 


std::cout «« "Hello, World!" «« std::endl; 
} 


然后 创建 一 个 hello.swigcxx 文件 ， 以 SWIG 语 法 导出 上 面 的 C++ 函数 SayHello : 


%module main 


%inline %{ 
extern void SayHello(); 
%} 


然后 在 Go 语言 中 直接 访问 sayHello 函数 〈 首 字母 自动 转 为 大 写字 母 ) 


package main 


import ( 
hello "." 
) 


func main() { 
hello.SayHello() 


} 


需要 将 上 述 3 个 文件 放 到 同一 个 目录 中 ， 并 且 hello. swigexx 和 Go 文件 对 应 同一 个 包 。 系 统 除 
了 需要 安装 Go 语言 环境 外 ， 还 需要 安装 对 应 版 本 的 SWIG 工 具 。 最 后 运行 go build 就 可 以 构 
RT 

ix: 4& Windows f ATF, 路 径 最 长 为 260 个 字符 . 这 个 程序 生成 的 中 间 cgo 文 件 可 能 导致 某 些 文 
件 的 绝对 路 径 长 度 超出 Windows 系 统 限 制 , 可 能 导致 程序 构建 失败 . 这 是 由 于 go build 调用 
SsWig 和 cgo 等 命令 生成 中 间 文 件 时 生成 的 不 合适 的 超 长 文件 名 导致 (作者 提交 /SSUE3358 > 
GoT1.8 已 经 修复 ) 。 


Go 汇编 语言 版 本 


Go 语言 底层 使 用 了 自己 独 有 的 跨 操 作 系统 汇编 语言 ， 该 汇编 语言 是 从 Plan9 系 统 的 汇编 语言 演 
化 而 来 。Go 汇 编 语 言 并 不 能 独立 使 用 ， 它 是 属于 Go 语言 的 一 个 组 成 部 分 ， 必 须 以 Go 语言 包 
的 方式 被 组 织 。 下 面 是 Go 汇编 语言 版 本 的 “Hello World" £75 : 

先 创建 一 个 main.go 文件 ， 以 Go 语言 的 语法 声明 包 和 声明 汇编 语言 对 应 的 函数 签名 ， 函 数 签 
A T SER RAM : 


package main 


func main() 


然后 创建 main amde4.s 文件 ， 对 应 Go 汇编 语言 实现 AMD64 架 构 的 main 函数 : 


Zinclude "textflag.h" 
include "funcdata.h" 


// "Hello World!^*n" 

DATA text«--*0(SB)/8,$"Hello Wo" 
DATA text«»*8(SB)/8, $"r1d!Nn" 
GLOBL text«»(SB), NOPTR, $16 


// func main() 
TEXT .main(SB), $16-0 
NO LOCAL POINTERS 
MOVQ $text<>+0(SB), AX 
MOVQ AX, (SP) 
MOVQ $16, 8(SP) 
CALL runtime:printstring(SB) 
RET 


代码 中 &include "textflag.h" 语 名 包含 运行 时 库 定义 的 头 文件 , 里 面 含 

有 NOPTR / NO LOCAL POINTERS 等 基本 的 宏 的 定义 。 DATA 汇编 指令 用 于 定义 数据 ， 每 个 数据 的 

宽度 必须 是 1/2/4/8， 然 后 coL 汇编 命令 在 当前 文件 内 导出 text 变量 符号 。 TEXT 

.main(SB), $16-0 用 于 定义 main 函数 ， 其 中 $16-6 表示 main 函数 的 帧 大 小 是 16 个 字 节 (对 
应 string 头 的 大 小 ， 用 于 给 runtime: ey 函数 传递 参数 ) > 表示 main 函数 没有 参数 

和 返回 值 。 main 函数 内 部 通 过 调用 运 行 时 内 部 的 runtime:printstring(SB) 函数 来 打印 字符 

o 


Go 汇编 语言 虽然 针对 每 种 CPU 架构 (主要 有 386/AMD64/ARM ARM64 等 ) 有 对 应 的 指令 和 
寄存 器 ， 但 是 汇编 语言 的 基本 语法 和 函数 调用 规范 是 一 致 的 ， 不 同 操作 系统 之 间 用 法 是 一 臻 
的 。 在 Go 语言 标准 库 中 ， runtime 运行 时 库 、 math 数学 库 和 crypto 密码 相关 的 函数 很 多 是 
id ND. 。 其 中 runtime 运行 时 库 中 采用 部 分 汇编 语言 并 不 完全 是 为 了 性 能 ， 而 


运行 时 的 某 些 特性 功能 〈 比 如 goroutine 上 下 文 的 切换 等 ) 2 occ ， 因 此 需要 汇编 
is 四 实现 辅助 功能 。 对 于 普通 用 户 而 言 ，Go 汇 编 语 言 的 最 大 价值 在 于 性 能 的 优化 ， 对 于 


性 能 比较 关键 的 地 方 ， 可 以 尝试 用 Go 汇编 语言 实现 终极 优化 。 


你 好 , 世界 ! - V2.0 


在 经 过 半 个 世纪 的 涅 加 重生 之 后 ，Go 语 言 不 仅仅 打印 出 了 Unicode 版 本 的 “Hello, World”， 而 
且 可 以 方便 地 向 全 球 用 户 提供 打印 服务 。 下 面 版 本 通过 http 服务 向 每 个 访问 的 客户 端 打 印 中 
文 的 “你 好 , 世界 "和 当前 的 时 间 信 息 。 


package main 


import ( 
Mum 
"log" 
Get /tsps 
tame» 

) 


func main() { 
fmt.Println("Please visit http://127.0.0.1:12345/") 
http.HandleFunc("/", func(w http.ResponseWwriter, req *http.Request) ( 
s := fmt.Sprintf(" 你 好 ， 世 界 ! -- Time: 95s", time.Now().String()) 
fmt.Fprintf(w, "%v\n", s) 
log.Printf("9;»v^n", s) 


19) 
if err := http.ListenAndServe(":12345", nil); err !- nil ( 
log.Fatal("ListenAndServe: ", err) 


我 们 通过 Go 语言 标准 库 自 带 的 net/nttp 包 构 造 了 一 个 独立 运行 的 http 服 务 。 其 

中 http.HandleFunc("/", ...) 针对 / 根 路 径 请 求 注册 了 响应 处 理 函 数 。 在 响应 处 理 函 数 中 ， 
我 们 依然 使 用 fmt.Fprintf 格式 化 输出 函数 实现 了 通过 http 协 议 向 请 求 的 客户 端 打印 格式 化 的 
字符 串 ， 同 时 通过 标准 库 的 日 志 包 在 服务 器 端 也 打印 相关 字符 串 。 最 后 通 

过 http.ListenAndserve 函数 调用 来 启动 http 服 务 。 


至 此 ，Go 语 言 终于 完成 了 从 单机 单 核 时 代 的 C 语 言 到 21 世 纪 互 联网 时 代 多 核 环 境 的 通用 编程 


WEHE 


1.3. 数组 、 字 符 串 和 切片 


在 主流 的 编程 语言 中 数组 及 其 相关 的 数据 结构 是 使 用 得 最 为 频繁 的 ， 只 有 在 它 ( 们 ) 不 能 满足 时 
才 会 考虑 链表 、hash 表 (hash 表 可 以 看 作 是 数组 和 链表 的 混合 体 ) 和 更 复杂 的 自 定义 数据 结 
构 。 


Go 语言 中 数组 、 字 符 串 和 切片 三 者 是 密切 相关 的 数据 结构 。 这 三 种 数据 类 型 ， 在 底层 原始 数 
据 有 着 相同 的 内 存 结构 ， 在 上 层 ， 因 为 语法 的 限制 而 有 着 不 同 的 行为 表现 。 首 先 ，Go 语 言 的 
数组 是 一 种 值 类 型 ， 虽 然 数组 的 元 素 可 以 被 修改 ， 但 是 数组 本 身 的 赋值 和 函数 传 参 都 是 以 整 
体 复制 的 方式 处 理 的 。Go 语 言 字符 串 底 层 数据 也 是 对 应 的 字 节 数组 ， 但 是 字符 串 的 只 读 属 性 
禁止 了 在 程序 中 对 底层 字 节 数组 的 元 素 的 修改 。 字 符 串 赋值 只 是 复制 了 数据 地 址 和 对 应 的 长 
度 ， 而 不 会 导致 底层 数据 的 复制 。 切 片 的 行为 更 为 灵活 ， 切 片 的 结构 和 字符 串 结构 类 似 ， 但 
是 解除 了 只 读 限制 。 切 片 的 底层 数据 虽然 也 是 对 应 数据 类 型 的 数组 ， 但 是 每 个 切片 还 有 独立 
的 长 度 和 容量 信息 ， 切 片 赋值 和 六 数 传 参数 时 也 是 将 切片 头 信 息 部 分 按 传 值 方式 处 理 。 因 为 
切片 头 含 有 底层 数据 的 指针 ， 所 以 它 的 赋值 也 不 会 导致 底层 数据 的 复制 。 其 实 Go 语 言 的 赋值 
和 函数 传 参 规则 很 简单 ， 除 了 闭 包 函数 以 引用 的 方式 对 外 部 变量 访问 之 外 ， 其 它 赋 值 和 函数 
传 参数 都 是 以 传 值 的 方式 处 理 。 要 理解 数组 、 字 符 串 和 切片 三 种 不 同 的 处 理 方式 的 原因 需要 
详细 了 解 它们 的 底层 数据 结构 。 


数组 


数组 是 一 个 由 固定 长 度 的 特定 类 型 元 素 组 成 的 序列 ， 一 个 数组 可 以 由 零 个 或 多 个 元 素 组 成 。 
数组 的 长 度 是 数组 类 型 的 组 成 部 分 。 因 为 数组 的 长 度 是 数组 类 型 的 一 个 部 分 ， 不 同 长 度 或 不 
同类 型 的 数据 组 成 的 数组 都 是 不 同 的 类 型 ， 因 此 在 Go 语言 中 很 少 直接 使 用 数组 (不同 长 度 的 
数组 因为 类 型 不 同 无 法 直接 赋值 ) 。 和 数组 对 应 的 类 型 是 切片 ， 切 片 是 可 以 动态 增长 和 收缩 
的 序列 ， 切 片 的 功能 也 更 加 灵活 ， 但 是 要 理解 切片 的 工作 原理 还 是 要 先 理解 数组 。 


我 们 先 看 看 数组 有 哪些 定义 方式 : 





var a [3]int // 定义 一 个 长 度 为 3 的 i 70 

ver o S isoo sinit: (Eb 27 IE AU e Sion 2753 

weal vo | the 3 IE M EL SEA 27S 

Vadis PEN EE E TET a 9/7 ME EU SEE Ar Or Or e S 


第 一 种 方式 是 定义 一 个 数组 变量 的 最 基本 的 方式 ， 数 组 的 长 度 明确 指定 ， 数 组 中 的 每 个 元 素 
都 以 零 值 初始 化 。 

第 二 种 方式 定义 数组 ， 可 以 在 定义 的 时 候 顺序 指定 全 部 元 素 的 初始 化 值 ， 数 组 的 长 度 根据 初 
始 化 元 素 的 数目 自动 计算 。 


第 三 种 方式 是 以 索引 的 方式 来 初始 化 数组 的 元 素 ， 因 此 元 素 的 初始 化 值 出 现 顺序 比较 随意 。 
这 种 初始 化 方式 和 map[int]rype 类 型 的 初始 化 语法 类 似 。 数 组 的 长 度 以 出 现 的 最 大 的 索引 为 
准 ， 没 有 明确 初始 化 的 元 素 依 然 用 0 值 初始 化 。 


第 四 种 方式 是 混合 了 第 二 种 和 第 三 种 的 初始 化 方式 ， 前 面 两 个 元 素 采 用 顺序 初始 化 ， 第 三 第 
四 个 元 素 零 值 初 始 化 ， 第 五 个 元 素 通 过 索引 初始 化 ， 最 后 一 个 元 素 跟 在 前 面 的 第 五 个 元 素 之 
后 采用 顺序 初始 化 。 


数组 的 内 存 结构 比较 简单 。 比 如 下 面 是 一 个 [4]int{2,3,5,7} 数组 值 对 应 的 内 存 结构 : 


primes := [4]int(2,3,5,7] 


[4]int 


Go 语言 中 数组 是 值 语义 。 一 个 数组 变量 即 表示 整个 数组 ， 它 并 不 是 隐 式 的 指向 第 一 个 元 素 的 
指针 (比如 C 语 言 的 数组 ) ， 而 是 一 个 完整 的 值 。 当 一 个 数组 变量 被 赋值 或 者 被 传递 的 时 候 ， 
实际 上 会 复制 整个 数组 。 如 果 数 组 较 大 的 话 ， 数 组 的 赋值 也 会 有 较 大 的 开销 。 为 了 避免 复制 
数组 带 来 的 开销 ， 可 以 传递 一 个 指向 数组 的 指针 ， 但 是 数组 指针 并 不 是 数组 。 


var a Laon Jat 2s ee YA 


&a 7/74 


var b 


fmt.Println(a[9], a[1]) // à 
fmt.Println(b[0], b[1])  // 通过 数组 指针 访问 数 纪 





DEM X 和 数组 类 似 





for i, v := range b { // 通过 数组 指针 和 迭代 数组 的 元 素 
fmt.Println(i, v) 


其 中 b 是 指向 a 数组 的 指针 ， 但 是 通过 p 访问 数组 中 元 素 的 写法 和 a 类 似 的 。 还 可 以 通 
过 for range 来 迭代 数组 指针 指向 的 数组 元 素 。 其 实数 组 指针 类 型 除了 类 型 和 数组 不 同 之 
外 ， 通 过 数组 指针 操作 数组 的 方式 和 通过 数组 本 身 的 操作 类 似 ， 而 且 数 组 指针 赋值 时 只 会 拷 
贝 一 个 指针 。 但 是 数组 指针 类 型 依然 不 够 灵活 ， 因 为 数组 的 长 度 是 数组 类 型 的 组 成 部 分 ， 指 
向 不 同 长 度数 组 的 数组 指针 类 型 也 是 完全 不 同 的 。 


可 以 将 数组 看 作 一 个 特殊 的 结构 体 ， 结 构 的 字段 名 对 应 数组 的 索引 ， 同 时 结构 体 成 员 的 数目 
x BEES). AEG ien 可 以 用 于 计算 数组 的 长 度 ， cap 函数 可 以 用 于 计算 数组 的 容量 。 不 
过 对 于 数组 类 型 来 说 ， len 和 cap 函数 返回 的 结果 始终 是 一 样 的 ， 都 是 对 应 数组 类 型 的 长 
Re 


我 们 可 以 用 for 循环 来 欠 代 数组 。 下 面 常见 的 几 种 方式 都 可 以 用 来 遍历 数组 : 


for i := range a ( 
fmt.Printf("b[9:d]: %d\n", i, b[i]) 

} 

for i, v := range b { 
fmt.Printf("b[96d]: %d\n", i, v) 

} 

Tom i= O Lene) dtt 
fmt.Printf("b[%d]: %d\n", i, b[i]) 


用 for range 方式 迭代 的 性 能 可 能 会 更 好 一 些 ， 因 为 这 种 迭代 可 以 保证 不 会 出 现 数组 越界 的 
情形 ， 每 轮 迭 代 对 数组 元 素 的 访问 时 可 以 省 去 对 下 标 越界 的 判断 。 


用 for range 方式 和 迭代， 还 可 以 忽略 迭代 时 的 下 标 : 


var times [5][0]int 

for range times { 
fmt.Println("hello") 

} 


其 中 times 对 应 一 个 [s][e]int 类 型 的 数组 ， 虽 然 第 一 维 数组 有 长 度 ， 但 是 数组 的 元 
素 [olint 大 小 是 0， 因 此 整个 数组 占用 的 内 存 大 小 依然 是 0。 没 有 付出 额外 的 内 存 代价 ， 我 们 
就 通过 for range 方式 实现 了 times 次 快速 迭代 。 


数组 不 仅仅 可 以 用 于 数值 类 型 ， 还 可 以 定义 字符 串 数 组 、 结 构 体 数组 、 函 数 数组 、 接 口 数 


组 、 管 道 数组 等 等 : 


// 字符 串 数 组 

var s1 = [2]string("hello", "world") 

var s2 = [...]string("4kXr", "4" 

var s3 - [...]string[i: "SJ", 0: "43$", j 


// 结构 体 数 组 

var linei [2]image.Point 

var line2 = [...]image.Point[image.Point[X: ©, Y: 0}, image.Point(X: 1, Y: 1}} 
var line3 = [...]image.Point([[90, ©}, (31, 1}} 


// 图 你 ic 
var decoder1 [2]func(io.Reader) (image.Image, error) 
var decoder2 = [...]func(io.Reader) (image.Image, error)( 





png.Decode, 
jpeg.Decode, 


// 接口 数组 
var unknowni [2]interface{} 
var unknown2 = [...]interface()(123, "你 好 "} 


// 管道 数组 


var chanList = [2]chan int{} 


我 们 还 可 以 定义 一 个 空 的 数组 : 


var d [6]int JU] Fe SESSEL, 
var e = [0]int()  // 定义 一 个 长 度 > l 
var f = [...]int() // 定义 二 个 长 度 为 0 的 数组 






长 度 为 0 的 数组 在 内 存 中 并 不 占用 空间 。 空 数组 虽然 很 少 直接 使 用 ， 但 是 可 以 用 于 强调 某 种 特 
有 类 型 的 操作 时 避免 分 配额 外 的 内 存 空间 ， 比 如 用 于 管道 的 同步 操作 : 


c1 := make(chan [0]int) 

go func() { 
fmt.Println("ci") 
c1 <- [0]int{} 

}() 


<-c1 


ERE’ RMÉTX SR PRAE A ERA Xo E RR e R ARER CRT RR, 
的 同步 。 对 于 这 种 场景 ， 我 们 用 空 数组 来 作为 管道 类 型 可 以 减少 管道 元 素 赋值 时 的 开销 。 当 
然 一 般 更 倾向 于 用 无 类 型 的 匿名 结构 体 代替 : 


c2 := make(chan struct{}) 
go func() { 

fmt.Println("c2") 

c2 <- struct( 4) // struct{} 部 分 是 类 型 ，{} 表 示 对 应 的 结构 体 值 
}() 


«-c2 


我 们 可 以 用 fmt.Printf 有 函数 提供 的 %T 或 %#v 谓词 语法 来 打印 数组 的 类 型 和 详细 信息 


fmt.Printf("b: TNn b) // b: [S3]int 
fmt.Printf("b: 9&vNn", b) // b: [S3]int(i, 2, 33 


在 Go 语言 中 ， 数 组 类 型 是 切片 和 字符 串 等 结构 的 基础 。 以 上 数组 的 很 多 操作 都 可 以 直接 用 于 
字符 囊 或 切片 中 。 


TE P 


一 个 字符 串 是 一 个 不 可 改变 的 字 节 序列 ， 字 符 串 通常 是 用 来 包含 人 类 可 读 的 文本 数据 。 和 数 
aM uU c da 。 每 个 字符 串 的 长 度 虽然 也 是 
国定 的 ， 但 是 字符 串 的 长 度 并 不 是 字符 串 类 型 的 一 。 由 于 Go 语言 的 源 代码 要 求 是 UTF8 编 
a HIGUA RA IULIPER EE RLSUTEORS A ERAT 
常 被 解释 为 采用 UTF8 编 码 的 Unicode 码 点 (rune) 序列 。 因 为 字 节 序列 对 应 的 是 只 读 的 字 
序列 ， 因 此 字符 串 可 以 包含 任意 的 数据 ， ipbyie 人 0。 AF SDULEI KSGBIHE 
UTF8 编 码 的 数据 ， 不 过 这 种 时 候 将 字符 串 看 作 是 一 个 只 读 的 二 进 制 数组 更 准确 ， 因 为 for 
range 等 语法 并 不 能 支持 非 UTF8 编 码 的 字符 串 的 遍历 。 


Go 语言 字符 串 的 底层 结构 在 reflect.stringdeader 中 定义 : 


type StringHeader struct { 
Data uintptr 
Len int 


字符 串 结构 由 两 个 信息 组 成 : 第 一 个 是 字符 串 指 向 的 底层 字 节 数组 ， 第 二 个 是 字符 串 的 字 节 
的 长 度 Eo 字符 串 其 实 是 一 个 ERIA > 因此 字符 串 的 赋值 操作 也 就 是 reflect.StringHeader 结构 
体 的 复制 过 程 ， 并 不 会 涉及 底层 字 节 数组 的 复制 。 在 前 面 数组 一 节 提 到 的 [2]string 字符 串 
数组 对 应 的 底层 结构 和 [2]reflect.stringHeader 对 应 的 底层 结构 是 一 样 的 ， 可 以 将 字符 串 数 
组 看 作 一 个 结构 体 数 组 。 


AAT VUE ER E "Hello, world” 本 身 对 应 的 内 存 结构 : 


EXEBEBESSEDEEEENM 





S := "hello, world" 
hello := s[:5] 
world ;= s[7:] 


4 9t TARIH > "Hello, world" 字 符 串 底层 数据 和 以 下 数组 是 完全 一 致 的 : 


var data = [...]byte£f'h', ye dole "uns on UPAL ' i 'w', yo ieu dre 'd'} 


字符 串 虽然 不 是 切片 ， 但 是 支持 切片 操作 ， 不 同位 置 的 切片 底层 也 访问 的 同一 块 内 存 数据 
(因为 字符 串 是 只 读 的 ， 相 同 的 字符 囊 面值 常量 通常 是 对 应 同一 个 字符 囊 常量 ) 


S := "hello, world" 
hello :- s[:5] 


world s[7:] 


S1 :- "hello, world"[:5] 
s2 :- "hello, world"[7:] 


和 数组 一 样 ， 内 置 的 len 和 cap 函数 返回 相同 的 结果 ， 都 对 应 字符 串 的 长 度 。 也 可 以 通 
过 reflect.StringHeader 结构 访问 字符 串 的 长 度 (这 里 只 是 为 了 演示 字符 串 的 结构 并 不 是 推 
荐 的 做 法 ) 


fmt.Println("len(s):", (*reflect.StringHeader)(unsafe.Pointer(&s)).Len) E AZ 
fmt.Println("len(s1):", (*reflect.StringHeader )(unsafe.Pointer(&s1)).Len) // 5 
fmt.Println("len(s2):", (*reflect.StringHeader)(unsafe.Pointer(&s2)).Len) // 5 


根据 Go 语言 规范 ，Go 语 言 的 源 文 件 都 是 采用 UTF8 编 码 。 因 此 ，Go 源 文件 中 出 现 的 字符 串 面 
值 常量 一 般 也 是 UTF8 编 码 的 (对 于 转 义 字符 ， 则 没有 这 个 限制 ) 。 提 到 Go 字符 串 时 ， 我 们 一 
般 都 会 假设 字符 囊 对 应 的 是 一 个 合法 的 UTF8 编 码 的 字符 序列 。 可 以 用 内 置 的 print 调试 函数 
或 fmt.Print žk E dEAT P » 4&9 T YAT] for range 循环 直接 遍历 UTF8 解 码 后 的 Unicode 码 点 
值 。 


下 面 的 “Hello, 世界 ”字符 串 中 包含 了 中 文字 符 ， 可 以 通过 打印 转型 为 字 节 类 型 来 查看 字符 底层 
对 应 的 数据 : 


fmt.Printf("%#v\n", []byte("Hello， 世 界 ")) 


输出 的 结果 是 : 


[]byte[0x48, 0x65, QOx6c, Ox6c, Ox6f, Ox2c, 0x20, Oxe4, Oxb8, 0x96, Oxe7, 0x95, QOx8c} 


分 析 可 以 发 现 oxe4, oxb8, oxoe 对 应 中 文 * 世 ”， oxe7, 0x95, oxsc 对 应 中 文 “ 界 ”。 我 们 也 可 以 


fmt.Println("Nxe4Nxb8Nx96") // 打印 : + 


fmt.Println("Nxe7Nx95Nx8c") // 打印 : J 


下 图 展示 了 “Hello, 世界 "字符 串 的 内 存 结构 布局 : 


世 界 







UTF-8encoding 


"Hello, ER" 


for i, r := range "Hello, tJ" ( 
fmt.Printf("%d\t%q\t%d\n", i, r, r) 


EMO Uu Bu PO 


) 


Go 语言 的 字符 串 中 可 以 存放 任意 的 二 进 制 字 节 序列 ， 而 且 即 使 是 UTF8 字 符 序 列 也 可 能 会 遇 到 
坏 的 编码 。 如 果 遇 到 一 个 错误 的 UTF8 编 码 输 入 ， 将 生成 一 个 特别 的 Unicode 字 符 AuFFFD'， 
这 个 字符 在 不 同 的 软件 中 的 显示 效果 可 能 不 太一 样 ， 在 印刷 中 这 个 符号 通常 是 一 个 黑色 六 角 
形 或 钻石 形状 ， 里 面包 含 一 个 白色 的 问号 ' 依 '。 


下 面 的 字符 串 中 ， 我 们 故意 损坏 了 第 一 字符 的 第 二 和 第 三 字 节 ， 因 此 第 一 字符 将 会 打印 
为 “@O”， 第 二 和 第 三 字 节 则 被 忽略 ， 后 面 的 “abce” 依 然 可 以 正常 解码 打印 (错误 编码 不 会 向 前 
扩散 是 UTF8 编 码 的 优秀 特性 之 一 ) o 


fmt.Printlin("\xe4\x00\x00\xe7\x95\x8cabc") // GJtabc 


不 过 在 for range 迭代 这 个 含有 损坏 的 UTF8 字 符 囊 时 ， 第 一 字符 的 第 二 和 第 三 字 节 依然 会 被 
单独 迭代 到 ， 不 过 此 时 迭代 的 值 是 损坏 后 的 0 : 


for i, c := range "Nxe4Nx00Nx0ONxe7Nx95Nx8cabc" { 
fmt.Println(i, c) 


} 
// 0 65533 // NuFFFD, XE 6 
//10 // 空 字 符 
2/2 // 空 字符 
// 3 30028 // 
// 6 97 //aà 
// 1 98 // b 
JG 


0 


如 果 不 想 解码 UTF8 字 符 串 ， 想 直接 遍历 原始 的 字 节 码 ， 可 以 将 字符 串 强 制 转 为 []byte 字 节 
序列 后 再 行 遍历 〈 这 里 的 转换 一 般 不 会 产生 运行 时 开销 ) 


for i, c := range []byte(" 世 界 abc") ( 
fmt.Println(i, c) 
} 


或 者 是 采用 传统 的 下 标 方式 遍历 字符 串 的 字 节 数组 : 


const s = "\xe4\x00\x00\xe7\x95\x8cabc" 
forai = 0 1< Len(s) itt f 
fmt.Printf("%d %x\n", i, s[i]) 


Go 语言 除了 for range 语法 对 UTF8 字 符 串 提供 了 特殊 支持 外 ， 还 对 字符 串 和 []rune 类 型 的 
相互 转换 提供 了 特殊 的 支持 。 


fmt.Printf("%#VvNn"，[]rune("Hel1o， 世 界 ")) // []int32{19990, 30028} 
fmt.Printf("%#v\n", string([]rune('X', 'R'})) // 世界 


从 上 面 代码 的 输出 结果 来 看 ， 我 们 可 以 发 现 []rune 其 实 是 []ints2 类 型 ， 这 里 的 rune 只 
是 int32 类 型 的 别名 ， 并 不 是 重新 定义 的 类 型 。 rune 用 于 表示 每 个 Unicode 码 点 ， 目 前 只 使 
用 了 21 个 bit 位 。 


字符 串 相 关 的 强制 类 型 转换 主要 涉及 到 []byte fe []rune 两 种 类 型 。 每 个 转换 都 可 能 隐 含 重 
新 分 配 内 存 的 代价 ， 最 坏 的 情况 下 它们 的 运算 时 间 复 杂 度 都 是 0(n) 。 不 过 字符 串 

和 []rune 的 转换 要 更 为 特殊 一 些 ， 因 为 一 般 这 种 强制 类 型 转换 要 求 两 个 类 型 的 底层 内 存 结构 
要 尽量 一 致 ， 显 然 它 们 底层 对 应 的 []byte 和 []int32 类 型 是 完全 不 同 的 内 部 布局 ， 因 此 这 种 
转换 可 能 隐 含 重新 分 配 内 存 的 操作 。 


下 面 分 别 用 伪 代 码 简 单 模拟 Go 语言 对 字符 串 内 置 的 一 些 操 作 ， 这 样 对 每 个 操作 的 处 理 的 时 间 
复杂 度 和 空间 复杂 度 都 会 有 较 明 确 的 认识 。 


for range 对 字符 串 的 迭代 模拟 实现 


func forOnString(s string, forBody func(i int, r rune)) ( 
for i= 90; len(s) » 0; ( 
r, size :- utf8.DecodeRuneInString(s) 
forBody(i, r) 
S = s[size:] 
i += size 


for range 迭代 字符 事 时 ， 每 次 解码 一 个 Unicode 字 符 ， 然 后 进入 for 循环 体 ， 遇 到 前 坏 的 编 
码 并 不 会 导致 迭代 停止 。 


[]byte(s) 转换 模拟 实现 


func str2bytes(s string) []byte { 
p := make([]byte, len(s)) 
fon i= O 1 s lens) Itr 
c :- s[i] 
p[i] = c 
} 


return p 


模拟 实现 中 新 创建 了 一 个 切片 ， 然 后 将 字符 串 的 数组 逐一 复制 到 了 切片 中 ， 这 是 为 了 保证 字 
符 串 只 读 的 语义 。 当 然 ， 在 将 字符 串 转 为 []byte 时 ， 如 果 转 换 后 的 变量 并 没有 被 修改 的 情 
形 ， 编 译 器 可 能 会 直接 返回 原始 的 字符 串 对 应 的 底层 数据 。 


string(bytes) 转换 模拟 实现 


func bytes2str(s []byte) (p string) { 
data := make([]byte, len(s)) 
foni St 
data[i] = c 


} 


hdr := (*reflect.StringHeader)(unsafe.Pointer(&p)) 
hdr.Data = uintptr(unsafe.Pointer(&data[0])) 
hdr.Len = len(s) 


return p 


因为 Go 语言 的 字符 串 是 只 读 的 ， 无 法 直接 同 构 构 造 底层 字 节 数组 生成 字符 串 。 在 模拟 实现 中 
通过 unsafe 包 获 取 了 字符 串 的 底层 数据 结构 ， 然 后 将 切片 的 数据 逐一 复制 到 了 字符 串 中 ， 这 
同样 是 为 了 保证 字符 串 只 读 的 语义 不 会 收 切 片 的 影响 。 如 果 转 换 后 的 字符 串 在 生命 周期 中 原 


15 8j []byte 的 变量 并 不 会 发 生变 化 ， 编译 器 可 能 会 直接 基于 []byte 底层 的 数据 构建 字符 
串 。 


[]rune(s) 转换 模拟 实现 


func str2runes(s []byte) []rune { 
var p []int32 
for len(s) > 0 ( 
r, size :- utf8.DecodeRuneInString(s) 


p = append(p, r) 
S = s[size:] 


} 


return []rune(p) 


因为 底层 内 存 结构 的 差异 ， 字 符 串 到 []rune 的 转换 必然 会 导致 重新 分 配 []rune 内 存 空 间 ， 
然后 依次 解码 并 复制 对 应 的 Unicode 码 点 值 。 这 种 强制 转换 并 不 存在 前 面 提 到 的 字符 串 和 字 节 
切片 转化 时 的 优化 情况 。 


string(runes) 转换 模拟 实现 


func runes2string(s []int32) string { 
var p []byte 
buf :- make([]byte, 3) 
for , r :- range s ( 
n :- utf8.EncodeRune(buf, r) 
p = append(p, buf[:n]...) 
} 


return string(p) 


同样 因为 底层 内 存 结 构 的 差异 >? []rune 到 字符 串 的 转换 也 必然 会 导致 重新 构造 字符 串 。 这 种 
强制 转换 并 不 存在 前 面 提 到 的 优化 情况 。 


1 A (slice) 


简单 地 说 ， 切 片 就 是 一 种 简化 版 的 动态 数组 。 因 为 动态 数组 的 长 度 是 不 国定 ， 切 片 的 长 度 自 

然 也 就 不 能 是 类 型 的 组 成 部 分 了 。 数 组 虽然 有 适用 它们 的 地 方 ， 但 是 数组 的 类 型 和 操作 都 不 

够 灵活 ， 因 此 在 Go 代码 中 数组 使 用 的 并 不 多 。 而 切片 则 使 用 得 相当 广泛 ， 理 解 切 片 的 原理 和 
用 法 是 一 个 Go 程序 员 的 必 备 技能 。 


我 们 先 看 看 切片 的 结构 定义 ， reflect.SliceHeader 


type SliceHeader struct { 
Data uintptr 
Len int 
Cap int 


可 以 看 出 切片 的 开头 部 分 和 Go 字符 串 是 一 样 的 ， 但 是 切片 多 了 一 个 cap 成 员 表 示 切 片 指向 的 
内 存 空间 的 最 大 容量 (对 应 元 素 的 个 数 ， 而 不 是 字 节 数 ) 。 下 图 是 x := 
[1int(2,3,5,7,11) 和 y := x[1:3] 两 个 切片 对 应 的 内 存 结构 。 


X we []1ritIt2,;3,5, 7, 113 


. 5 | 5 []int 
ptr en cap 
[5]int 
y cw XLI] 


Dint 


让 我 们 看 看 切片 有 哪些 定义 方式 : 
























var ( 
a []int // nil 切 片 ， 和 nil 相等 ， 一 般 用 来 表示 一 个 不 存在 的 切片 
b = []int{} // 空 切片 ， 和 nil 不 相等 ， 一 般 用 来 表示 一 个 空 的 集合 
cme 2 // 有 3 个 元 素 的 切片 ， Len 和 cap 都 为 3 
d = c[:2] // 1 元 素 的 切片 ， len 为 2，cap 为 3 
e - c[0:2:cap(c)] JEn mE] len 为 2，cap 为 3 
f = c[:9] // 有 0 个 元 素 的 切片 ， Len 为 0， cap 为 3 
g = make([]int, 3) // R3^7 len 和 cap 都 为 3 
h = make([]int, 2, 3) // 有 2 个 元 素 的 切片 ，len 为 2，cap 为 3 
i = make([]int, 0, 3) // 有 0 个 元 素 的 切片 ， Len 为 9，cap 为 3 
) 


和 数组 一 样 ， 内 置 的 len 兄 数 返回 切片 中 有 效 元 素 的 长 度 ， 内 置 的 cap 函数 返回 切片 容量 大 
小 ， 容 量 必须 大 于 或 等 于 切片 的 长 度 。 也 可 以 通过 reflect.sliceHeader 结构 访问 切片 的 信息 

只 是 为 了 说 明 切 片 的 结构 ， 并 不 是 推荐 的 做 法 ) 。 切 片 可 以 和 nii 进行 比较 ， 只 有 当 切 片 
底层 数据 指针 为 空 时 切片 本 身 为 nil ， 这 时 候 切 片 的 长 度 和 容量 信息 将 是 无 效 的 。 如 果 有 切 
片 的 底层 数据 指针 为 空 ， 但 是 长 度 和 容量 不 为 0 的 情况 ， 那 么 说 明 切 片 本 身 已 经 被 损坏 了 【( 比 
如 直接 通过 reflect.SliceHeader 或 unsafe 包 对 切片 作 了 不 正确 的 修改 ) 。 


遍历 切片 的 方式 和 遍历 数组 的 方式 类 似 : 


for i := range a ( 
fmt.Printf("b[9:d]: %d\n", i, a[i]) 
} 
for i, v := range b { 
fmt.Printf("b[9?:d]: %d\n", i, v) 
} 


Tom i= Or 0s len(c); dtt 
fmt.Printf("b[9?:d]: %d\n", i, c[i]) 


其 实 除 了 遍历 之 外 ， 只 要 是 切片 的 底层 数据 指针 、 长 度 和 容量 没有 发 生变 化 的 话 ， 对 切片 的 
人 遍历、 元 素 的 读 取 和 修改 都 和 数组 是 一 样 的 。 在 对 切片 本 身 赋 值 或 参数 传递 时 ， 和 数组 指针 
的 操作 方式 类 似 ， 只 是 复制 切片 头 信 息 ( reflect.sliceHeader ) ， 并 不 会 复制 底层 的 数据 。 
对 于 类 型 ， 和 数组 的 最 大 不 同 是 ， 切 片 的 类 型 和 长 度 信 息 无 关 ， 只 要 是 相同 类 型 元 素 构成 的 
切片 均 对 应 相同 的 切片 类 型 。 


如 前 所 说 ， 切 片 是 一 种 简化 版 的 动态 数组 ， 这 是 切片 类 型 的 灵魂 。 除 了 构造 切片 和 遍历 切片 
之 外 ， 添 加 切片 元 素 、 删 除 切片 元 素 都 是 切片 处 理 中 经 常 遇 到 的 问题 。 


添加 切片 元 素 


内 置 的 泛 型 函数 append 可 以 在 切片 的 尾部 追加 N 个 元 素 : 


var a []int 





a - append(a, 1) // ià 
a - append(a, 1, 2, 3) I du RACE 
a = append(a, []int([1,2,3]...) // Æ 


不 过 要 注意 的 是 ， 在 容量 不 足 的 情况 下 ， append 的 操作 会 导致 重新 分 配 内 存 ， 从 而 导致 巨大 
的 内 存 分 配 和 复制 数据 代价 。 即 使 容量 足够 ， 依 然 需 要 用 append 函数 的 返回 值 来 更 新 切片 本 
身 ， 因 为 新 切片 的 长 度 已 经 发 生 了 变化 。 


除了 在 切片 的 尾部 追加 ， 我 们 还 可 以 在 切片 的 开头 添加 元 素 : 
var a = []int{1,2,3} 


append([]int[0), a...) // 在 天 
append([]int[-3,-2,-1), a...) // 在 天 
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在 开头 一 般 都 会 导致 内 存 的 重新 分 配 ， 而 且 会 导致 已 有 的 元 素 全 部 复制 1 次 。 因 此 ， 从 切片 的 
开头 添加 元 素 的 性 能 一 般 要 比 从 尾部 追加 元 素 的 性 能 差 很 多 。 


由 于 append 哆 数 返回 新 的 切片 ， 也 就 是 它 支 持 链 式 操作 。 我 们 可 以 将 多 个 append 操作 组 合 
起 来 ， 实 现在 切片 中 间 插 入 元 素 : 


var a []int 
a = append(a[:i], append([]int[xj, a[i:]...)...) // 在 第 i 个 位 置 插入 
a = append(a[:i], append([]int[1,2,3), a[i:]...)...) // 在 第 i 个 位 置 插入 





每 个 添加 操作 中 的 第 二 个 appena 调用 都 会 创建 一 个 临时 切片 ， 并 将 api] 的 内 容 复制 到 新 创 
建 的 切片 中 ， 然 后 将 临时 创建 的 切片 再 追加 到 a[:i] 。 


可 以 用 copy 和 appena 组 合 可 以 避免 创建 中 间 的 临时 切片 ， 同 样 是 完成 添加 元 素 的 操作 : 


a = append(a, 0) — // 切片 扩展 1 个 空间 
copy(a[i+1:], a[i:]) // a[i:] 9$ € 
a[i] = x // 设置 新 添加 的 元 素 








一 名 append 用 于 扩展 切片 的 长 度 ， 为 要 插入 的 元 素 留 出 空间 。 第 二 多 copy 操作 将 要 插入 
位 置 开 始 之 后 的 元 素 向 后 挪动 一 个 位 置 。 第 三 句 丨 实地 将 新 添加 的 元 素 赋 值 到 对 应 的 位 置 。 
操作 语句 虽然 宛 长 了 一 点 ， 但 是 相 比 前 面 的 方法 ， 可 以 减少 中 间 创 建 的 临时 切片 。 


用 copy 和 append 组 合 也 可 以 实现 在 中 间 位 置 插入 多 个 元 素 ( 也 就 是 插入 一 个 切片 ): 


a = append(a, x...) // Axnhà E 
copy(a[i-Tlen(x):], a[i:]) // a[i:] s 


copy(a[i:], x) // 复制 新 添加 的 切片 






2dea 个 位 置 


稍 显 不 足 的 是 ， 在 第 一 名 扩展 切片 容量 的 时 候 ， 扩 展 空 间 部 分 的 元 率 复 制 是 没有 必要 的 。 ji 
没 专门 有 内 置 的 函数 用 于 扩展 切片 的 容量 ， appn 本 质 是 用 于 追加 元 素 而 不 是 扩展 容量 
展 切片 容量 只 是 append 的 一 个 副 | 作用 。 


删除 切片 元 素 


根据 要 删除 元 素 的 位 置 有 三 种 类 型 : 从 开头 位 置 删除 ， 从 中 间 位 置 删除 ， 从 尾部 删除 。 其 中 
删除 切片 尾部 的 元 素 最 快 


ae inet, 2% 
a = a[:len(a)-1] // 删除 尾部 1 个 元 素 
a = a[:len(a)-N] // 删除 尾部 N 个 元 素 





删除 开头 的 元 素 需 要 对 剩余 的 元 素 进行 一 次 整体 挪动 ， 可 以 用 append 原 地 完成 (所 谓 原 地 完 
成 是 指 在 原 有 的 切片 数据 对 应 的 内 存 区 间 内 完成 ， 不 会 导致 内 存 空间 结构 的 变化 ) 


a = []int{1, 2, 3) 
= append(a[:0], a[1:]...) // 删除 开头 1 个 元 素 
append(a[:0], a[N:]...) // 删除 开头 N 个 元 素 
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也 可 以 用 copy 完成 删除 开头 的 元 素 : 


a = []int{1, 2, 3} 
= a[:copy(a, a[1:])] // 删除 开头 1 个 元 素 
a[:copy(a, a[N:])] // 删除 开头 N 个 元 素 


[eb 
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对 于 删除 中 间 的 元 素 ， 需 要 对 剩余 的 元 素 进 行 一 次 整体 挪动 ， 同 样 可 以 用 append 或 copy Æ 
地 完成 : 
eu E ugs a S anah 


a = append(a[:i], a[i-1:]... 
a = append(a[:i], a[i-*N:]... 





a = a[:i*copy(a[i:], a[i*1:])] // lH TIA14s;0X 
a = a[:i*copy(a[i:], a[itN:])] // 删除 中 间 N 个 元 素 


删除 开头 的 元 素 和 删除 尾部 的 元 素 都 可 以 认为 是 删除 中 间 元 素 操 作 的 特殊 情况 。 


切片 内 存 技巧 


在 本 节 开 头 的 数组 部 分 我 们 提 到 过 有 类 似 [elint 的 空 数组 ， 空 数组 一 般 很 少 用 到 。 但 是 对 于 
切片 来 说 ^ len 为 o 但 是 cap 容量 不 为 o 的 切片 则 是 非常 有 用 的 特性 o 当然， 如 

果 len 和 cap AR o 的 话 ， 则 变 成 一 个 真正 的 空 切片 ， 虽然 它 并 不 是 一 个 nil 值 的 切片 。 
在 判断 一 个 切片 是 否 为 空 时 ， 一 般 通 过 len 获取 切片 的 长 度 来 判断 ， 一 般 很 少将 切片 

和 nil 值 做 直接 的 比较 。 


比如 下 面 的 rrimspace HAA TAR []byte 中 的 空格 。 函 数 实现 利用 了 0 长 切片 的 特性 ， 实 
现 高 效 而 且 简 洁 。 


func TrimSpace(s []byte) []byte { 


b := s[:0] 
ODE X E= range S y 
Xf 
b = append(b, x) 
} 
} 
return b 


其 实 类 似 的 根据 过 滤 条 件 原 地 删除 切片 元 素 的 算法 都 可 以 采用 类 似 的 方式 处 理 (因为 是 删除 
操作 不 会 出 现 内 存 不 足 的 情形 ) 


func Filter(s []byte, fn func(x byte) bool) []byte { 
b := s[:0] 
forc X = range sc 
if !fn(x) A 
b - append(b, x) 
} 
} 


return b 


切片 高 效 操 作 的 要 点 是 要 降低 内 存 分 配 的 次 数 ， 尽 量 保证 append 操作 不 会 超出 cap 的 容量 ， 
降低 触发 内 存 分 配 的 次 数 和 每 次 分 配 内 存 大 小 。 


避免 切片 内 存 泄漏 


如 前 面 所 说 ， 切 片 操 作 并 不 会 复制 底层 的 数据 。 底 层 的 数组 会 被 保存 在 内 存 中 ， 直 到 它 不 再 
被 引用 。 但 是 有 时 候 可 能 会 因为 一 个 小 的 内 存 引 用 而 导致 底层 整个 数组 处 于 被 使 用 的 状态 ， 
这 会 延迟 自动 内 存 回收 器 对 底层 数组 的 回收 。 


例如 ， FindphoneNumber 元 数 加 载 整 个 文件 到 内 存 ， 然 后 搜索 第 一 个 出 现 的 电话 号 码 ， 最 后 结 
果 以 切片 方式 返回 


func FindPhoneNumber(filename string) []byte { 
b, | := ioutil.ReadFile(filename) 
return regexp.MustCompile("[0-9]-").Find(b) 


这 段 代 码 返 回 的 [byte 指向 保存 整个 文件 的 数组 。 因 为 切片 引用 了 整个 原始 数组 ， 导 致 自动 
垃圾 回收 器 不 能 及 时 释放 底层 数组 的 空间 。 一 个 小 的 需求 可 能 导致 需要 长 时 间 保 存 整 个 文件 
数据 。 这 虽然 这 并 不 是 传统 意义 上 的 内 存 泄漏 ， 但 是 可 能 会 拖 慢 系统 的 整体 性 能 。 


要 修复 这 个 问题 ， 可 以 将 感 兴趣 的 数据 复制 到 一 个 新 的 切片 中 (数据 的 传 值 是 Go 语言 编程 的 
一 个 哲学 ， 虽 然 传 值 有 一 定 的 代价 ， 但 是 换取 好 处 是 切断 了 对 原始 数据 的 依赖 ) 


func FindPhoneNumber(filename string) []byte { 
b, | := ioutil.ReadFile(filename) 
b = regexp.MustCompile("[0-9]-").Find(b) 
return append([]byte([), b...) 


类 似 的 问题 ， 在 删除 切片 元 素 时 可 能 会 遇 到 。 假 设 切 片 里 存放 的 是 指针 对 象 ， 那 么 下 面 删 除 
末尾 的 元 素 后 ， 被 删除 的 元 素 依 然 被 切片 底层 数组 引用 ， 从 而 导致 不 能 及 时 被 自动 垃圾 回收 
器 回收 (这 要 依赖 回收 器 的 实现 方式 ) 


var a []*int( ... ) 
a = a[:ien(a)-1] // 本 删除 的 最 后 一 个 元 素 依然 被 引用 ， 可 能 导致 6C 操 作 被 阻碍 


保险 的 方式 是 先 将 需要 自动 内 存 回 收 的 元 素 设置 为 nil ， 保 证 自动 回收 器 可 以 发 现 需要 回收 
的 对 象 ， 然 后 再 进行 切片 的 删除 操作 : 


var a []*int( ... 
a[len(a)-1] = nil // GCu x 
a = a[:len(a)-1] // 从 切片 








当然 ， 如 果 切 片 存在 的 周期 很 短 的 话 ， 可 以 不 用 刻意 处 理 这 个 问题 。 因 为 如 果 切 片 本 身 已 经 
可 以 被 GC 回收 的 话 ， 切 片 对 应 的 每 个 元 素 自然 也 就 是 可 以 被 回收 的 了 。 

切片 类 型 强制 转换 

为 了 安全 ， 当 两 个 切片 类 型 pr 和 py 的 底层 原始 切片 类 型 不 同时 ，Go 语 言 是 无 法 直接 转换 
类 型 的 。 不 过 安全 都 是 有 一 定 代价 的 ， 有 时 候 这 种 转换 是 有 它 的 价值 的 一 -可 以 简化 编码 或 
者 是 提升 代码 的 性 能 。 比 如 在 64 位 系统 上 ， 需 要 对 一 个 []float64 切片 进行 高 速 排 序 ， 我 们 
可 以 将 它 强制 转 为 []int 整数 切片 ， 然 后 以 整数 的 方式 进行 排序 (因为 float64 遵循 
IEEE754 浮 点 数 标准 特性 ， 当 浮 点 数 有 序 时 对 应 的 整数 也 必然 是 有 序 的 ) 。 


下 面 的 代码 通过 两 种 方法 将 []float64 类 型 的 切片 转换 为 [lint 类 型 的 切片 : 


// +build amd64 arm64 
import "sort" 
var a - []floate4[(4, 2, 5, 7, 2, 1, 88, 1) 


func SortFloat6e4FastVi1(a []floate64) { 


// 强制 类 型 转换 
var b []int = ((*[1 << 20]int)(unsafe.Pointer(&a[0])))[:len(a):cap(a)] 


// 以 int 方 式 给 float64 排 序 
sort.Ints(b) 
} 


func SortFloat64FastV2(a []float64) { 
// 通过 reflect.SliceHeader 更 新 切片 头 部 信息 实现 转换 


var c []int 

aHdr :- (*reflect.SliceHeader)(unsafe.Pointer(&a)) 
cHdr :- (*reflect.SliceHeader)(unsafe.Pointer(&c)) 
*cHdr - *aHdr 


// 以 int 方 式 给 float64 排 序 
sort.Ints(c) 


第 一 种 强制 转换 是 先 将 切片 数据 的 开始 地 址 转换 为 一 个 较 大 的 数组 的 指针 ， 然 后 对 数组 指针 
对 应 的 数组 重新 做 切片 操作 。 中 间 需 要 unsafe.Pointer 来 连接 两 个 不 同类 型 的 指针 传递 。 需 
要 注意 的 是 ，Go 语 言 实现 中 非 0 大 小 数组 的 长 度 不 得 超过 2GB， 因 此 需要 针对 数组 元 素 的 类 型 
A 小 计算 数组 的 最 大 长 度 范围 ( [juints X X2GB  []uintie 最 大 1GB， 以 此 类 推 ， 但 

Æ []struct{} 数组 的 长 度 可 以 超过 2GB) » 


二 种 转换 操作 是 分 别 取 到 两 个 不 同类 型 SRA 头 信息 指针 ， 任 何 类 型 的 切片 头 部 信息 底层 
reflect.SliceHeader 结构 ， 然 后 通过 更 新 结构 体 方 式 来 更 新 切片 信息 ， 从 而 实 
现 a 对 应 的 []float64 切片 到 c 对 应 的 []int 类 型 切片 的 转换 。 


过 基准 测试 ， 我 们 可 以 发 现 用 sort.Ints 对 转换 后 的 [lint 排序 的 性 能 要 比 
用 sort.Floateas 排序 的 性 能 好 一 点 。 不 过 需要 注意 的 是 ， 这 个 方法 可 行 的 前 提 是 要 保 
证 []float64 T Nol en coros $5 $E (因为 浮 点 数 中 NaN 不 可 排序 ， 正 0 和 负 0 相 
， 但 是 整数 中 没有 这 类 情形 ) 。 


1.4. 函数 、 方 法 和 接口 


函数 对 应 操作 序列 ， 是 程序 的 基本 组 成 元 素 。 Go 语言 中 的 函数 有 具名 和 匿名 之 分 : 具名 函数 
一 般 对 应 于 包 级 的 函数 ， 是 匿名 函数 的 一 种 特例 ， 当 匿名 函数 引用 了 外 部 作用 域 中 的 变量 时 
就 成 了 闭 包 函数 ， 闭 包 函 数 是 函数 式 编程 语言 的 核心 。 方 法 是 绑 定 到 一 个 具体 类 型 的 特殊 函 
数 ，Go 语 言 中 的 方法 是 依托 于 类 型 的 ， 必 须 在 编译 时 静态 绑 定 。 接 口 定义 了 方法 的 集合 ， 这 
些 方法 依托 于 运行 时 的 接口 对 象 ， 因 此 接口 对 应 的 方法 是 在 运行 时 动态 绑 定 的 。Go 语 言 通过 
隐 式 接口 机 制 实现 了 鸭子 面向 对 象 模型 。 


Go 语言 程序 的 初始 化 和 执行 总 是 从 main.main 有 函数 开始 的 。 但 是 如 果 main 包 导 入 了 其 它 的 
包 ， 则 会 按照 顺序 将 它们 包含 进 main 包 里 (这 里 的 导入 顺序 依赖 具体 实现 ， 一 般 可 能 是 以 文 
件 名 或 包 路 径 名 的 字符 囊 顺 序 导 入 ) 。 如 果 茶 个 包 被 多 次 导入 的 话 ， 在 执行 的 时 候 只 会 导入 
一 次 。 当 一 个 包 被 导入 时 ， 如 果 它 还 导入 了 其 它 的 包 ， 则 先 将 其 它 的 包 和 包含 进来 ， 然 后 创建 
和 初始 化 这 个 包 的 常量 和 变量 ,再 调用 包 里 的 init 函数 ， 如 果 一 个 乌有 多 个 init 函数 的 话 ， 
调用 顺序 未 定义 (实现 可 能 是 以 文件 名 的 顺序 调用 )， 同 一 个 文件 内 的 多 个 init 则 是 以 出 现 的 
顺序 依次 调用 ( init 不 是 普通 函数 ， 可 以 定义 有 多 个 ， 所 有 也 不 能 被 其 它 函 数 调 用 ) 。 最 
后 ， 当 main 包 的 所 有 包 级 常量 、 变 量 被 创建 和 初始 化 完成 ， 并 且 init 函数 被 执行 后 ， 才 会 
进入 main.main 函数 ， 程 序 开 始 正常 执行 。 下 图 是 Go 程序 函数 启动 顺序 的 示意 图 : 

















pkgl pkg2 
— import pkgl import pkg2 import pkg3 


const ... COllSE ss 


init() init() init() 
, 


main() 





要 注意 的 是 ， 在 main.main 函数 执行 之 前 所 有 代码 都 运行 在 同一 个 goroutine， 也 就 是 程序 的 
主 系统 线程 中 。 因 此 ， 如 果 茶 个 init HAARA goX4t FE A 1 319]goroutinet]3£ > 3153 
goroutine ^ 有 在 进入 main.main 有 函数 之 后 才 可 能 被 执行 到 。 


在 Go 语言 中 ， 函 数 是 第 一 类 对 象 ， 我 们 可 以 将 函数 保持 到 变量 中 。 函 数 主要 有 具名 和 匿名 之 
分 ， 包 级 函数 一 般 都 是 具名 函数 ， 具 名 函数 是 匿名 函数 的 一 种 特例 。 当 然 ，Go 语 言 中 每 个 类 
型 还 可 以 有 自己 的 方法 ， 方 法 其 实 也 是 函数 的 一 种 。 


// 具名 函数 
func Add(a, b int) int { 
return a+b 


j 


// EZ Až 
var Add = func(a, b int) int { 
return atb 


} 


Go 语言 中 的 函数 可 以 有 多 个 输入 参数 和 多 个 返回 值 ， 输 入 参数 和 返回 值 都 是 以 传 值 的 方式 和 
被 调用 者 交换 数据 。 在 语法 上 ， 函 数 还 支持 可 变数 量 的 参数 ， 可 变数 量 的 参数 必须 是 最 后 出 
现 的 参数 ， 可 变数 量 的 参数 其 实 是 一 个 切片 类 型 的 参数 。 


// 多 个 输入 参数 和 多 个 返回 值 
func Swap(a, b int) (int, int) { 
return b, a 








} 
// 本 变数 
// more * ]int 切片 类 型 
func Sum(a int, more ...int) int { 
for , v := range more ( 
a += Vv 
} 
return a 
} 


当 可 变 参 数 是 一 个 空 接口 类 型 时 ， 调 用 者 是 否 解 包 可 变 参数 会 导致 不 同 的 结果 : 


func main() { 
var a = []interface{}{123, "abc" 


Print(a...) // 123 abc 
Print(a) // [123 abc] 


} 

func Print(a ...interface{}) { 
fmt.Println(a...) 

} 


第 一 个 Print 调用 时 传 入 的 参数 是 a... ， 等 价 于 直接 调用 Print(123, "abc") ° $= 
个 Print 调用 传 入 的 是 为 解 包 的 a ， 等 价 于 直接 调用 Print([]interface{}{123, "abc")) ° 


不 仅 函 数 的 输入 参数 可 以 有 名 字 ， 也 可 以 给 函数 的 返回 值 命 名 : 


func Find(m map[int]int, key int) (value int, ok bool) { 
return m[key] 


回 值 命 名 了 ， 可 以 通过 名 字 来 修改 返回 值 ， 也 可 以 通过 defer 语句 在 return 语句 之 后 


func Inc() (v int) { 
defer func()( v** } () 
return 42 


其 中 defer 语句 延迟 执行 了 一 个 匿名 函数 ， 因 为 这 个 匿名 函数 捕获 了 外 部 函数 的 局 部 变 
E v ， 这 种 函数 我 们 一 般 叫 闭 包 。 闭 包 对 捕获 的 外 部 变量 并 不 是 传 值 方 式 访问 ， 而 是 以 引用 
的 方式 访问 。 


闭 包 的 这 种 引用 方式 访问 外 部 变量 的 行为 可 能 会 导致 一 些 隐 含 的 问题 : 


func main() { 


pom ab WES Op dis e ans JI 
defer func(){ println(i) } () 
b 
} 
// Output: 
Ju Sj 
27 S) 
NA 


因为 是 闭 包 在 for 迭代 语句 中 * 每 个 defer 语句 延迟 执行 的 函数 引用 的 都 是 同一 个 i 迭代 
变量 ， 在 循环 结束 后 这 个 变量 的 值 为 3， 因 此 最 终 输出 的 都 是 3。 


修复 的 思路 是 在 每 轮 和 迭代 中 为 每 个 defer 函数 生成 独 有 的 变量 。 可 以 用 下 面 两 种 方式 : 


func main() { 
(oye ab WES OR Bb cs cy Blas TE 
i := i // 定义 一 个 循环 体内 局 部 变量 i 
defer func(){ println(i) } () 


} 
} 
func main() { 
fon 19: — 0, iS EISE TE TI 
// 通过 函数 传 入 I 
// defer 语句 会 马上 对 调用 参数 求 值 


defer func(i int){ println(i) ) (i) 


第 一 种 方法 是 在 循环 体内 部 再 定义 一 个 局 部 变量 ， 这 样 每 次 迭代 defer 18 4] hg A 6L P CAR HA 
的 都 是 不 同 的 变量 ， 这 些 变量 的 值 对 应 选 代 时 的 值 。 第 二 种 方式 是 将 迭代 变量 通过 闭 包 函数 
的 参数 传 入 ， defer 语句 会 马上 对 调用 参数 求 值 。 两 种 方式 都 是 可 以 工作 的 。 不 过 一 般 来 说 ， 
在 for 循环 内 部 执行 defer 语句 并 不 是 一 个 好 的 习惯 ， 此 处 仅 为 示例 ， 不 建议 使 用 


Go 语言 中 ， 如 果 以 切片 为 参数 调用 函数 时 ， 有 时 候 会 给 人 一 种 参数 采用 了 传 引用 的 方式 的 假 
象 : 因为 在 被 调用 函数 内 部 可 以 修改 传 入 的 切片 的 元 素 。 其 实 ， 任 何 可 以 通过 函数 参数 修改 
调用 参数 的 情形 ， 都 是 因为 函数 参数 中 显 式 或 隐 式 传 入 了 指针 参数 。 函 数 参 数 传 值 的 规范 更 
准确 说 是 只 针对 数据 结构 中 国定 的 部 分 传 值 ， 例 如 字符 囊 或 切片 对 应 结构 体 中 的 指针 和 字符 
串 长 度 结 构 体 传 值 ， 但 是 并 不 包含 指针 间接 指向 的 内 容 。 将 切片 类 型 的 参数 替换 为 类 
似 reflect.SliceHeader 结构 体 就 很 好 理解 切片 传 值 的 含义 了 : 


func twice(x []int) { 


for i :- range x { 
x[i] *- 2 
} 
} 
type IntSliceHeader struct { 
Data []int 
Len int 
Cap int 


} 


func twice(x IntSliceHeader) { 
foni 3-005 I< xuleng Itf 
x.Data[i] *= 2 


因为 切片 中 的 底层 数组 部 分 是 通过 隐 式 指针 传递 (指针 本 身 依然 是 传 值 的 ， 但 是 指针 指向 的 却 
是 同一 份 的 数据 )， 所 以 被 调用 有 子 数 是 可 以 通过 指针 修改 掉 调 用 参数 切片 中 的 数据 。 除 了 数据 
之 外 ， 切 片 结构 还 包含 了 切片 长 度 和 切片 容量 信息 ， 这 2 个 信息 也 是 传 值 的 。 如 果 被 调用 函数 
中 修改 了 Len X cap 信息 的 话 ， 就 无 法 反映 到 调用 参数 的 切片 中 ， 这 时 候 我 们 一 般 会 通过 返 
回 修改 后 的 切片 来 更 新 之 前 的 切片 。 这 也 是 为 何 内 置 的 append 必须 要 返回 一 个 切片 的 原因 。 


Go 语言 中 ， 函 数 还 可 以 直接 或 间接 地 调用 自己 ， 也 就 是 支持 递归 调用 。Go 语 言 函 数 的 递归 调 
用 深度 逻辑 上 没有 限制 ， 函 数 调 用 的 栈 是 不 会 出 现 溢出 错误 的 ， 因 为 Go 语言 运行 时 会 根据 需 
要 动态 地 调整 函数 栈 的 大 小 。 每 个 goroutine 刚 启动 时 只 会 分 配 很 小 的 栈 (4 或 8KB， 具 体 依 赖 
实现 ) ， 根 据 需 要 动态 调整 栈 的 大 小 ， 栈 最 大 可 以 达到 GB 级 (依赖 具体 实现 ) 。 在 Go1.4 以 
前 ，Go 的 动态 栈 采 用 的 是 分 段 式 的 动态 栈 ， 通 俗 地 说 就 是 采用 一 个 链表 来 实现 动态 栈 ， 每 个 
链表 的 节点 内 存 位 置 不 会 发 生变 化 。 但 是 链表 实现 的 动态 栈 对 某 些 导致 跨越 链表 不 同 节 点 的 
热点 调用 的 性 能 影响 较 大 ， 因 为 相 邻 的 链表 节点 它们 在 内 存 位 置 一 般 不 是 相 邻 的 ， 这 会 增加 
CPU 高 速 缓存 命中 失败 的 几率 。 为 了 解决 热点 调用 的 CPU 缓存 命中 率 问 题 ，Go1.4 之 后 改 用 
连续 的 动态 栈 实现 ， 也 就 是 采用 一 个 类 似 动态 数组 的 结构 来 表示 栈 。 不 过 连续 动态 栈 也 带 来 
了 新 的 问题 : 当 连 续 栈 动态 增长 时 ， 需 要 将 之 前 的 数据 移动 到 新 的 内 存 空 间 ， 这 会 导致 之 前 
栈 中 全 部 变量 的 地 址 发 生变 化 。 虽 然 Go 语 言 运 行 时 会 自动 更 新 引用 了 地 址 变化 的 栈 变 量 的 指 
针 ， 但 最 重要 的 一 点 是 要 明白 Go 语言 中 指针 不 再 是 国定 不 变 的 了 (因此 不 能 随意 将 指针 保持 
到 数值 变量 中 ，Go 语 言 的 地 址 也 不 能 随意 保存 到 不 在 GC 控 制 的 环境 中 ， 因 此 使 用 CGO 时 不 
能 在 C 语 言 中 长 期 持 有 Go 语言 对 象 的 地 址 ) 。 


因为 ，Go 语 言 函 数 的 栈 不 会 溢出 ， 所 以 普通 Go 程序 员 已 经 很 少 需要 关心 栈 的 运行 机 制 的 。 在 
Go 语言 规范 中 甚至 故意 没有 讲 到 栈 和 堆 的 概念 。 我 们 无 法 知道 函数 参数 或 局 部 变量 到 底 是 保 
存在 栈 中 还 是 堆 中 ， 我 们 只 需要 知道 它们 能 够 正常 工作 就 可 以 了 。 看 看 下 面 这 个 例子 : 


func f(x int) *int { 
return &x 


} 


func g() int { 
x = new(int) 
return *x 


PARA BER SLT A CA CREE NUBE UC TEARS YA ^ EL ZU de IR CE EX 
上 的 话 ， 函 数 返回 之 后 栈 变 量 就 失效 了 ， 返 回 的 地 址 自然 也 应 该 失效 了 。 但 是 Go 语言 的 编译 
器 和 运行 时 比 我 们 聪明 的 多 ， 它 会 保证 指针 指向 的 变量 在 合适 的 地 方 。 第 二 个 函数 ， 内 部 虽 
然 调用 new 函数 创建 了 *int 类 型 的 指针 对 象 ， 但 是 依然 不 知道 它 具 体 保存 在 哪里 。 对 于 有 
C/C++ 编程 经 验 的 程序 员 需 要 强调 的 是 : 不 用 关心 Go 语言 中 函数 栈 和 堆 的 问题 ， 编 译 器 和 运 
行 时 会 帮 我 们 搞定 ; 同样 不 要 假设 变量 在 内 存 中 的 位 置 是 固定 不 变 的 ， 指 针 随 时 可 能 会 变 
化 ， 特 别 是 在 你 不 期 望 它 变化 的 时 候 。 


Z ik 


方法 一 般 是 面向 对 象 编程 (OOP) 的 一 个 特性 ， 在 C++ 语言 中 方法 对 应 一 个 类 对 象 的 成 员 函 数 ， 
是 关联 到 具体 对 象 上 的 虚 表 中 的 。 但 是 Go 语言 的 方法 却 是 关联 到 类 型 的 ， 这 样 可 以 在 编译 阶 
段 完 成 方法 的 静态 绑 定 。 一 个 面向 对 象 的 程序 会 用 方法 来 表达 其 属性 和 对 应 的 操作 ， 这 样 使 
用 这 个 对 象 的 用 户 就 不 需要 直接 去 操作 对 象 ， 而 是 借助 方法 来 做 这 些 事情 。 面 向 对 象 编 程 
(OOP) 进 入 主流 开发 领域 一 般 认 为 是 从 C++ 开始 的 ，C++ 就 是 在 兼容 C 语 言 的 基础 之 上 支持 了 
class 等 面向 对 象 的 特性 。 然 后 Java 编 程 则 号 称 是 纯粹 的 面向 对 象 语 言 ， 因 为 Java 中 函数 是 不 
能 独立 存在 的 ， 每 个 函数 都 必然 是 属于 某 个 类 的 。 


面向 对 象 编程 更 多 的 只 是 一 种 思想 ， 很 多 号 称 支持 面向 对 象 编程 的 语言 只 是 将 经 常用 到 的 特 
性 内 置 到 语言 中 了 而 已 。Go 语 言 的 祖先 C 语 言 虽然 不 是 一 个 支持 面向 对 象 的 语言 ， 但 是 C 语 言 
的 标准 库 中 的 File 相 关 的 函数 也 用 到 了 的 面向 对 象 编程 的 思想 。 下 面 我 们 实现 一 组 C 语 言 风 格 
的 File 函 数 : 


// 文件 对 外 

type File struct { 
fd int 

} 

// d X4 

func OpenFile(name string) (f *File, err error) ( 
/i Ir ep 

J 

// X 闭 人 


func CloseFile(f *File) error ( 


VÀ 
VEI CAD 


j 

// 读 文件 数据 

func ReadFile(f *File, int64 offset, data []byte) int ( 
7B tene 

} 


其 中 openFile 类 似 构 造 函 数 用 于 打开 文件 对 象 ， closeFile 类 似 析 构 函 数 用 于 关闭 文件 对 
象 ，ReadFile 则 类 似 普 通 的 成 员 函 数 ， 这 三 个 函数 都 是 普通 的 元 

数 。 closeFile 和 ReadFile 作为 普通 函数 ， 需 要 占用 和 包 级 空间 中 的 名 字 资 源 。 不 

过 closeFile 和 ReadFile 函数 只 是 针对 File 类 型 对 象 的 操作 ， 这 时 候 我 们 更 希望 这 类 函数 
和 操作 对 象 的 类 型 紧密 绑 定 在 一 起 。 


Go 语言 中 的 做 法 是 ， 将 closeFile 和 ReadFile 函数 的 第 一 个 参数 移动 到 有 函数 名 的 开头 : 


// 关闭 文件 
func (f *File) CloseFile() error { 


AT 

// 读 文 件数 据 

func (f *File) ReadFile(int64 offset, data []byte) int { 
AAA 

} 


这 样 的 话 ， closeFile 和 ReadFile 函数 就 成 了 File 类 型 独 有 的 方法 了 (而 不 是 File 对 象 方 
法 ) 。 它 们 也 不 再 占用 包 级 空间 中 的 名 字 资 源 ， 同 时 rie 类 型 已 经 明确 了 它们 操作 对 象 ， 因 
此 方法 名 字 一 般 简 化 为 close 和 Read 


// 关闭 文件 

func (f *File) Close() error { 
A 

} 

// 读 文 件数 据 

func (f *File) Read(int64 offset, data []byte) int { 
NE 

} 


将 第 一 个 函数 参数 移动 到 函数 前 面 ， 从 代码 角度 看 虽然 只 是 一 个 小 的 改动 ， 但 是 从 编程 哲学 
角度 来 看 ，Go 语 言 已 经 是 进入 面向 对 象 语言 的 行列 了 。 我 们 可 以 给 任何 自 定义 类 型 添加 一 个 
或 多 个 方法 。 每 种 类 型 对 应 的 方法 必须 和 类 型 的 定义 在 同一 个 包 中 ， 因 此 是 无 法 给 int 这 类 
内 置 类 型 添加 方法 的 (因为 方法 的 定义 和 类 型 的 定义 不 在 一 个 包 中 ) 。 对 于 给 定 的 类 型 ， 每 
个 方法 的 名 字 必 须 是 唯一 的 ， 同 时 方法 和 元 数 一 样 也 不 支持 重 载 。 


方法 是 由 函数 演变 而 来 ， 只 是 将 函数 的 第 一 个 对 象 参数 移动 到 了 函数 名 前 面 了 而 已 。 因 此 我 
们 依然 可 以 按照 原始 的 过 程式 思维 来 使 用 方法 。 通 过 叫 方法 表达 式 的 特性 可 以 将 方法 还 原 为 
普通 类 型 的 函数 : 


// 不 依赖 具体 的 文件 对 象 
// func CloseFile(f *File) error 
var CloseFile - (*File).Close 


// 不 依赖 具体 的 文件 对 象 
// func ReadFile(f *File, int64 offset, data []byte) int 
var ReadFile - (*File).Read 


// 文件 处 理 

f, _ := OpenFile("foo.dat") 
ReadFile(f, 0, data) 
CloseFile(f) 


在 有 些 场景 更 关心 一 组 相似 的 操作 : 比如 Read 读 取 一 些 数组 ， 然 后 调用 close 关闭 。 此 时 的 
环境 中 ， 用 户 并 不 关心 操作 对 象 的 类 型 ， 只 要 能 满足 通用 的 Read fe close 行为 就 可 以 了 。 不 
过 在 方法 表达 式 中 ， 因 为 得 到 的 ReadFile 和 closerile 函数 参数 中 含有 File 这 个 特有 的 类 
型 参数 ， 这 使 得 File 相关 的 方法 无 法 和 其 它 不 是 File 类 型 但 是 有 着 相同 Read 和 close 方 
法 的 对 象 无 缝 适 配 。 这 种 小 困难 难 不 倒 我 们 Go 语言 码 农 ， 我 们 可 以 通过 结合 闭 包 特性 来 消除 
方法 表达 式 中 第 一 个 参数 类 型 的 差异 : 


// 先 打开 文件 对 象 
f, _ := OpenFile("foo.dat") 


// 绑 定 到 了 f 对 象 

// func Close() error 

var Close = func Close() error { 
return (*File).Close(f) 


// Hx T f «X 

// func Read(int64 offset, data []byte) int 

var Read - func Read(int64 offset, data []byte) int ( 
return (*File).Read(f, offset, data) 


} 

Wh 文 件 处 理 
Read(0, data) 
Close() 


这 刚好 是 方法 值 也 要 解决 的 问题 。 我 们 用 方法 值 特性 可 以 简化 实现 : 


// RATE XM 
f, _ := OpenFile("foo.dat") 


// 方法 值 : 绑 定 到 了 f 对 象 
// func Close() error 
var Close - f.Close 


// 方法 值 : WEIT f 对 象 
// func Read(int64 offset, data []byte) int 
var Read - f.Read 


// 文件 处 理 
Read(0, data) 
Close() 


Go 语言 不 仅 支持 传统 面向 对 象 中 的 继承 特性 ， 而 是 以 自己 特有 的 组 合 方式 支持 了 方法 的 继 
承 。Go 语 言 中 ， 通 过 在 结构 体内 置 匿名 的 成 员 来 实现 继承 : 


import "image/color" 
type Point struct( X, Y float64 } 


type ColoredPoint struct ( 
Point 
Color color.RGBA 


虽然 我 们 可 以 将 coloredPoint 定义 为 一 个 有 三 个 字段 的 扁平 结构 的 结构 体 ， 但 是 我 们 这 里 
将 Point AŽ] coloredPoint 来 提供 x fe v 这 两 个 字段 。 


var cp ColoredPoint 

cp X= 
fmt.Println(cp.Point.X) // "1" 
cp.Point.Y = 2 
fmt.Println(cp.Y) 72/2020 
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所 对 应 的 方法 。 我 们 一 般 会 将 Point 看 作 基 类 ， 把 ColoredPoint 看 作 是 它 的 继承 类 或 子 类 。 不 
过 这 种 方式 继承 的 方法 并 不 能 实现 C++ 中 虚 函 数 的 多 态 特 性 。 所 有 继承 来 的 方法 的 接收 者 参数 
依然 是 那个 匿名 成 员 本 身 ， 而 不 是 当前 的 变量 。 


type Cache struct { 
m map[string]string 
sync.Mutex 


} 


func (p *Cache) Lookup(key string) string { 
p.Lock() 
defer p.Unlock() 


return p.m[key] 


Cache AIRRA 38 3d dE AX — AS ES 8g sync.Mutex 来 继承 它 的 Lock 和 unlock 方法 . 但 是 在 
调用 p.Lock() fe p.unlock() It, p 并 不 是 Lock 和 unlock 方法 的 站 正 接收 者 , 而 是 会 将 它们 
展开 为 p.Mutex.Lock() 和 p.Mutex.Unlock() 调用 . 这 种 展开 是 编译 期 完成 的 , 并 没有 运行 时 代 


fr. 


在 传统 的 面向 对 象 语言 (eg.C++ 或 Javal) 的 继承 中 ， 子 类 的 方法 是 在 运行 时 动态 绑 定 到 对 象 
的 ， 因 此 基 类 实现 的 某 些 方法 看 到 的 this 可 能 不 是 基 类 类 型 对 应 的 对 象 ， 这 个 特性 会 导致 基 
类 方法 运行 的 不 确定 性 。 而 在 Go 语言 通过 齿 入 匿名 的 成 员 来 “继承 "的 基 类 方法 ， this 就 是 实 
现 该 方法 的 类 型 的 对 象 ，Go 语 言 中 方法 是 编译 时 静态 绑 定 的 。 如 果 需 要 虚 函 数 的 多 态 特性 ， 
我 们 需要 借助 Go 语言 接口 来 实现 。 


接口 


Go 语言 之 父 Rob Pike $ 35:4 — 4] & : 那些 试图 避免 白狐 行为 的 语言 最 终 自己 变 成 了 白 洗 语 
言 (Languages that try to disallow idiocy become themselves idiotic) 。 一 般 静 态 编程 语言 
都 有 着 严格 的 类 型 系统 ， 这 使 得 编译 器 可 以 深入 检查 程序 员 没 有 作出 什么 出 格 的 举动 。 但 

是 ， 过 于 严格 的 类 型 系统 却 会 使 得 编程 太 过 繁琐 ， 让 程序 员 把 大 好 的 青春 都 浪费 在 了 和 编译 
器 的 斗争 中 。Go 语 言 试 图 让 程序 员 能 在 安全 和 灵活 的 编程 之 间 取 得 一 个 平衡 。 它 在 提供 严格 
的 类 型 检查 的 同时 ， 通 过 接口 类 型 实现 了 对 鸭子 类 型 的 支持 ， 使 得 安全 动态 的 编程 变 得 相对 


Go 的 接口 类 型 是 对 其 它 类 型 行为 的 抽象 和 概括 ; 因为 接口 类 型 不 会 和 特定 的 实现 细节 绑 定 在 
一 起 ， 通 过 这 种 抽象 的 方式 我 们 可 以 让 对 象 更 加 灵活 和 更 具有 适应 能 力 。 很 多 面向 对 象 的 语 
言 都 有 相似 的 接口 概念 ， 但 Go 语言 中 接口 类 型 的 独特 之 处 在 于 它 是 满足 隐 式 实现 的 鸭子 类 

型 。 所 谓 鸭 子 类 型 说 的 是 : 只 要 走 起 路 来 像 鸣 子 、 叫 起 来 也 像 鸣 子 ， 那 么 就 可 以 把 它 当 作 鸣 
子 。Go 语 言 中 的 面向 对 象 就 是 如 此 ， 如 果 一 个 对 象 只 要 看 起 来 像 是 菜 种 接口 类 型 的 实现 ， 那 
么 它 就 可 以 作为 该 接口 类 型 使 用 。 这 种 设计 可 以 让 你 创建 一 个 新 的 接口 类 型 满足 已 经 存在 的 
具体 类 型 却 不 用 去 破坏 这 些 类 型 原 有 的 定义 ; 当 我 们 使 用 的 类 型 来 自 于 不 受 我 们 控制 的 包 时 
这 种 设计 尤其 灵活 有 用 。Go 语 言 的 接口 类 型 是 延迟 绑 定 ， 可 以 实现 类 似 庶 函 数 的 多 态 功 能 。 


接口 在 Go 语言 中 无 处 不 在 ， 在 “Hello world” 的 例子 中 ， fmt.Printf 函数 的 设计 就 是 完全 基于 
接口 的 ， 它 的 i 3E fe h fmt.Fprintf 函数 完成 9 用 于 表示 错误 的 error 类 型 更 是 内 置 的 接 
口 类 型 。 在 C 语 言 中 ，printf 只 能 将 几 种 有 限 的 基础 数据 类 型 打印 到 文件 对 象 中 。 但 是 Go 语 
言 灵 活 接口 特性 ， fmt.Fprintf 却 可 以 向 任何 自 定义 的 输出 流 对 象 打 印 ， 可 以 打印 到 文件 或 标 
准 输 出 、 也 可 以 打印 到 网 络 、 甚 至 可 以 打印 到 一 个 压缩 文件 ; 同时 ， 打 印 的 数据 也 不 仅仅 局 
限于 语言 内 置 的 基础 类 型 ， 任 意 隐 式 满足 fmt.Stringer 接口 的 对 象 都 可 以 打印 ， 不 满 

X. fmt,Stringer 接口 的 依然 可 以 通过 反射 的 技术 打印 。 fmt.Fprintf 函数 的 签名 如 下 : 


func Fprintf(w io.Wwriter, format string, args ...interface{}) (int, error) 


其 中 io.writer 用 于 输出 的 接口 ， error 是 内 置 的 错误 接口 ， 它 们 的 定义 如 下 : 


type io.writer interface ( 
Write(p []byte) (n int, err error) 
} 


type error interface { 
Error() string 


} 


我 们 可 以 通过 定制 自己 的 输出 对 象 ， 将 每 个 字符 转 为 大 写字 符 后 输出 : 


type UpperWriter struct { 
io.Writer 


func (p *Upperwriter) write(data []byte) (n int, err error) ( 
return p.Writer(bytes.ToUpper(data)) 


func main() { 
fmt.Fprintln(&UpperWriter[os.Stdout), "hello, world") 


当然 ， 我 们 也 可 以 定义 自己 的 打印 格式 来 实现 将 每 个 字符 转 为 大 写字 符 后 输出 的 效果 。 对 于 
每 个 要 打印 的 对 象 ， 如 果 满 足 了 fmt.stringer 接口 ， 则 默认 使 用 对 象 的 string 方法 返回 的 结 
果 打 印 : 


type UpperString string 


func (s UpperString) String() string { 
return strings.ToUpper(s) 


type fmt.Stringer interface { 
String() string 


func main() { 
fmt.Fprintln(os.Stdout, UpperString("hello, world")) 


Go 语言 中 ， 对 于 基础 类 型 〈 非 接口 类 型 ) 不 支持 隐 式 的 转换 ， 我 们 无 法 将 一 个 int 类 型 的 值 
直接 赋值 给 int64 类 型 的 变量 ， 也 无 法 将 inc 类 型 的 值 赋值 给 底层 是 inc 类 型 的 新 定义 命名 
类 型 的 变量 。Go 语 言 对 基础 类 型 的 类 型 一 致 性 要 求 可 谓 是 非常 的 严格 ， 但 是 Go 语言 对 于 接口 
类 型 的 转换 则 非常 的 灵活 。 对 象 和 接口 之 间 的 转换 、 接 口 和 接口 之 间 的 转换 都 可 能 是 隐 式 的 
转换 。 可 以 看 下 面 的 例子 : 





var ( 
a io.ReadCloser = (*os.File)(f) // K *os.File 类 型 满足 了 io.ReadCloser 接口 
b io.Reader = a AR , io.ReadCloser 满足 了 io.Reader 接口 
c io.Closer -a 7/7. lis io.ReadCloser 满足 了 io.Closer 接口 
d io.Reader = c.(io.Reader) // 显 式 转换 ， io.Closer 并 不 显 式 满足 io.Reader 接口 
) 


有 时 候 对 象 和 接口 之 间 太 灵活 了 ， 导 致 我 们 需要 人 为 地 限制 这 种 无 意 之 间 的 适 配 。 常 见 的 做 
法 是 定义 一 个 含 特殊 方法 来 区 分 接口 。 比 如 runtime 包 中 的 error 接口 就 定义 了 一 个 特有 
的 RuntimeError 方法 ， 用 于 避免 其 它 类 型 无 意 中 适 配 了 该 接口 : 


type runtime.Error interface { 
error 


// RuntimeError is a no-op function but 

// serves to distinguish types that are run time 
// errors from ordinary errors: a type is a 

// run time error if it has a RuntimeError method. 


RuntimeError() 


4& protobuf Message 接口 也 采用 了 类 似 的 方法 ， 也 定义 了 一 个 特有 的 ProtoMessage ^? 用 
于 避免 其 它 类 型 无 意 中 适 配 了 该 接口 : 


type proto.Message interface { 
Reset() 
String() string 
ProtoMessage( ) 


不 过 这 种 做 法 只 是 君子 协定 ， 如 果 有 人 刻意 伪造 一 个 proto.Message 接口 也 是 很 容易 的 。 再 严 
格 一 点 的 做 法 是 给 接口 定义 一 个 私有 方法 。 只 有 满足 了 这 个 私有 方法 的 对 象 才 可 能 满足 这 个 
接口 ， 而 私有 方法 的 名 字 是 包含 包 的 绝对 路 径 名 的 ， 因 此 只 能 在 包 内 部 实现 这 个 私有 方法 才 
能 满足 这 个 接口 。 测 试 包 中 的 testing.PB 接口 就 是 采用 类 似 的 技术 : 


type testing.TB interface { 
Error(args ...interface(]) 
Errorf(format string, args ...interface(]) 


// A private method to prevent users implementing the 
// interface and so future additions to it will not 
// violate Go 1 compatibility. 

private() 


不 过 这 种 通过 私有 方法 禁止 外 部 对 象 实现 接口 的 做 法 也 是 有 代价 的 : 首先 是 这 个 接口 只 
内 部 使 用 ， 外 部 包 正 常情 ee dM dM LAE ; 其 次 ， 这 种 防护 措 z 
是 绝对 的 ， 恶 意 的 用 户 依然 可 以 绕 过 这 种 保护 机 制 。 


在 前 面 的 方法 一 节 中 我 们 讲 到 ， 通 过 在 结构 体 中 嵌入 匿名 类 型 成 员 ， 可 以 继承 匿名 类 型 的 方 
法 。 其 实 这 个 被 谋 入 的 匿名 成 员 不 一 定 是 普通 类 型 ， 也 可 以 是 接口 类 型 。 我 们 可 以 通过 嵌入 
匿名 的 testing.PB 接口 来 伪造 私有 的 private 方法 ， 因 为 接口 方法 是 延迟 绑 定 ， 编 译 

时 private 方法 是 否 丨 的 存在 并 不 重要 。 


package main 


import ( 
EMES 
"testing" 
) 


type TB struct { 
testing.TB 


func (p *TB) Fatal(args ...interface{}) { 
fmt.Println("TB.Fatal disabled!") 


func main() { 
var tb testing.TB - new(TB) 
tb.Fatal("Hello, playground") 


我 们 在 自己 的 pp 结构 体 类 型 中 重新 实现 了 Fatal 方法 ， 然 后 通过 将 对 象 隐 式 转换 
为 testing,TB 接口 类 型 (AXAR IEEE 8 testing.TB 对 象 ， 因 此 是 满足 testing.TB 接口 
的 ) ， 然 后 通过 testing.TB 接口 来 调用 我 们 自己 的 Fatal 方法 。 


这 种 通过 胡 入 匿名 接口 或 通 入 匿名 指针 对 象 来 实现 继承 的 做 法 其 实 是 一 种 纯 虚 继承 ， 我 们 继 
承 的 只 是 接口 指定 的 规范 ， 在 正 的 实现 在 运行 的 时 候 才 被 注入 。 上 比如， 我 们 可 以 模拟 实现 一 
个 grpc 的 插件 : 


type grpcPlugin struct { 
*generator.Generator 


func (p *grpcPlugin) Name() string { return "grpc" } 
func (p *grpcPlugin) Init(g *generator.Generator) ( 


p.Generator - g 


func (p *grpcPlugin) GenerateImports(file *generator.FileDescriptor) { 
if len(file.Service) == 0 { 


return 


p.P('import "google.golang.org/grpc"') 
A 


构造 的 grpcPlugin 类 型 对 象 必 须 满足 generate.Plugin 接口 


(在 "github.com/golang/protobuf/protoc-gen-go/generator" 包 中 ) 


type Plugin interface { 
// Name identifies the plugin. 
Name() string 
// Init is called once after data structures are built but before 
// code generation begins. 
Init(g *Generator) 
// Generate produces the code generated by the plugin for this file, 
// except for the imports, by calling the generator's methods P, In, and Out. 
Generate(file *FileDescriptor) 
// GeneratelImports produces the import declarations for this file. 
// It is called after Generate. 
GeneratelImports(file *FileDescriptor) 


generate.Plugin 接口 对 应 的 grpcPlugin 类 型 的 GenerateImports 方法 中 使 用 的 p.P(...) HÀ 

数 却 是 通过 rnit 函数 注入 的 generator.Generator 对 象 实 现 。 这 里 的 generator.Generator 对 
应 一 个 具体 类 型 ， 但 是 如 果 generator.Generator 是 接口 类 型 的 话 我 们 甚至 可 以 传 入 直接 的 实 
现 。 


Go 语言 通过 几 种 简单 特性 的 组 合 ， 就 轻易 就 实现 了 鸭子 面向 对 象 和 虚拟 继承 等 高 级 特性 ， 提 
的 是 不 可 思议 。 


1.5. 面向 并 发 的 内 和 存 模 型 


在 早期 ，CPU 都 是 以 单 核 的 形式 顺序 执行 机 器 指令 。Go 语 言 的 祖先 C 语 言 正 是 这 种 顺序 编程 
语言 的 代表 。 顺 序 编程 语言 中 的 顺序 是 指 :所 有 的 指令 都 是 以 串 行 的 方式 执行 ， 在 相同 的 时 刻 
有 且 仅 有 一 个 CPU 在 顺序 执行 程序 的 指令 。 


随 着 处 理 器 技术 的 发 展 ， 单 核 时 代 以 提升 处 理 器 频率 来 提高 运行 效率 的 方式 遇 到 了 瓶颈 ， 目 
前 各 种 主流 的 CPU 频率 基本 被 锁定 在 了 3GHZ 附 近 。 单 核 CPU 的 发 展 的 停 兆 ， 给 多 核 CPU 的 
发 展 带 来 了 机 遇 。 相 应 地 ， 编 程 语 言 也 开始 逐步 向 并 行 化 的 方向 发 展 。Go 语 言 正 是 在 多 核 和 
网 络 化 的 时 代 背 景 下 诞生 的 原生 支持 并 发 的 编程 语言 。 


常见 的 并 行 编程 有 多 种 模型 ， 主 要 有 多 线程 、 消 息 传递 等 。 从 理论 上 来 看 ， 多 线程 和 基于 消 
息 的 并 发 编程 是 等 价 的 。 由 于 多 线程 并 发 模型 可 以 自然 对 应 到 多 核 的 处 理 器 ， 主 流 的 操作 系 
统 因此 也 都 提供 了 系统 级 的 多 线程 支持 ， 同 时 从 概念 上 讲 多 线程 似乎 也 更 直观 ， 因 此 多 线程 
编程 模型 逐步 被 吸纳 到 主流 的 编程 语言 特性 或 语言 扩展 库 中 。 而 主流 编程 语言 对 基于 消息 的 
并 发 编程 模型 支持 则 相 比 较 少 ，Erlang 语 言 是 支持 基于 消息 传递 并 发 编程 模型 的 代表 者 ， 它 的 
并 发 体 之 间 不 共享 内 存 。Go 语 言 是 基于 消息 并 发 模型 的 集大成 者 ， 它 将 基于 CSP 模 型 的 并 发 
编程 内 置 到 了 语言 中 ， 通 过 一 个 go 关键 字 就 可 以 轻易 地 局 动 一 个 Goroutine， 与 Erlang 不 同 的 
是 Go 语言 的 Goroutine 之 间 是 共享 内 存 的 。 


Goroutine 和 系统 线程 


Goroutine 是 Go 语言 特有 的 并 发 体 ， 是 一 种 轻 量 级 的 线程 ， 由 go 关键 字 尼 动 。 在 趴 实 的 Go 语 
言 的 实现 中 ，goroutine 和 系统 线程 也 不 是 等 价 的 。 尽 管 两 者 的 区 别 实际 上 只 是 一 个 量 的 区 
别 ， 但 正 是 这 个 量变 引发 了 Go 语言 并 发 编程 质 的 飞跃 。 


首先 ， 每 个 系统 级 线程 都 会 有 一 个 固定 大 小 的 栈 (一 般 默 认可 能 是 2MB) ， 这 个 栈 主 要 用 来 
保存 函数 递归 调用 时 参数 和 局 部 变量 。 国 定 了 栈 的 大 小 这 导致 了 两 个 问题 : 一 是 对 于 很 多 只 
需要 很 小 的 栈 空间 的 线程 来 说 是 一 个 巨大 的 浪费 ， 二 是 对 于 少数 需要 巨大 栈 空间 的 线程 来 说 
又 面临 栈 溢出 的 风险 。 针 对 这 两 个 问题 的 解决 方案 是 : 要 么 降低 固定 的 栈 大 小 ， 提 升 空 间 的 
利用 这 ;要 么 增 大 栈 的 深度 以 允许 更 深 的 函数 递归 调用 ， 但 这 两 者 是 没 法 同时 兼 得 的 。 相 反 ， 
一 个 Goroutine 会 以 一 个 很 小 的 栈 启 动 (可 能 是 2KB 或 4KB) ， 当 遇 到 深度 递归 导致 当前 栈 空 
间 不 足 时 ，Goroutine 会 根据 需要 动态 地 伸缩 栈 的 大 小 (主流 实现 中 栈 的 最 大 值 可 达到 
1GB) 。 国 为 启动 的 代价 很 小 ， 所 以 我 们 可 以 轻易 地 局 动 成 千 上 万 个 Goroutine 。 


Go 的 运行 时 还 包含 了 其 自己 的 调度 器 ， 这 个 调度 器 使 用 了 一 些 技术 手段 ， 可 以 在 n 个 操作 系统 
线程 上 多 工 调度 m 个 Goroutine。Go 调 度 器 的 工作 和 内 核 的 调度 是 相似 的 ， 但 是 这 个 调度 器 只 
关注 单独 的 Go 程序 中 的 Goroutine。Goroutine 采 用 的 是 半 抢 占 式 的 协作 调度 ， 只 有 在 当前 


Goroutine 发 生 阻 塞 时 才 会 导致 调度 ; 同时 发 生 在 用 户 态 ， 调 度 器 会 根据 具体 函数 只 保存 必要 
的 寄存 器 ， 切 换 的 代价 要 比 系统 线程 低 得 多 。 和 运行 时 有 一 个 runtime.GOMAXPROCS 变量 ， 用 于 
控制 当前 运行 正常 非 阻 塞 Goroutine 的 系统 线程 数目 。 


言 中 局 动 一 个 Goroutine 不 仅 和 调用 函数 一 样 简单 ， 而 且 Goroutine 之 间 调 度 代 价 也 很 
低 ， 些 因 素 极 大 地 促进 了 并 发 编程 的 流行 和 发 展 。 


原子 操作 


所 谓 的 原子 操作 就 是 并 发 编程 中 "最 小 的 且 不 可 并 行 化 "的 操作 。 ， 有 多 个 并 发 体 对 一 个 共 
享 资源 的 操作 是 原子 操作 的 话 ， 同 Eaa A iai fie ee 资源 进行 操作 。 从 线程 
角度 看 ， 在 当前 线程 修改 共享 资源 期 间 ， 其 它 的 线程 是 不 能 访问 该 资源 的 。 原 子 操作 对 于 多 
线程 并 发 编程 模型 来 说 ， 不 会 发 生 有 别 于 单线 程 的 意外 情 青 况 ， 共 享 资源 的 完整 性 可 以 得 到 保 
证 。 


一 般 情 况 下 ， 原 子 操作 都 是 通过 “ 互 太 "访问 来 保证 访问 的 ， 通 常 由 特殊 的 CPU 指令 提供 保护 。 
当然 ， 如 果 仅 仅 是 想 模拟 下 粗 粒度 的 原子 操作 ， 我 们 可 以 借助 于 sync.Mutex 来 实现 : 


import ( 
"n sync " 


) 


var total struct ( 
sync.Mutex 
value int 


} 


func worker(wg *sync.WaitGroup) { 
defer wg.Done() 


for i := 0; i <= 100; itr ( 
total.Lock() 
total.value += i 
total.Unlock() 


} 


func main() { 
var wg sync.WaitGroup 
wg.Add(2) 
go worker(&wg) 
go worker(&wg) 
wg.Wait() 


fmt.Println(total.value) 


在 worker 的 循环 中 ， 为 了 保证 total.value += i 的 原子 性 ， 我 们 通过 sync.Mutex 加 锁 和 解 
锁 来 保证 该 语句 在 同一 时 刻 只 被 一 个 线程 访问 。 对 于 多 线程 模型 的 程序 而 言 ， 进 出 临界 区 前 

后 进行 加 锁 和 解锁 都 是 必须 的 。 如 果 没 有 锁 的 保护 ， total 的 最 终 值 将 由 于 多 线程 之 间 的 竞 
争 而 可 能 会 不 正确 。 


用 互 斥 锁 来 保护 一 个 数值 型 的 共享 资源 ， 麻 烦 且 效率 低下 。 标 准 库 的 sync/atomic 包 对 原子 操 
作 提 供 了 丰富 的 支持 。 我 们 可 以 重新 实现 上 面 的 例子 


import ( 
" Sync " 
"sync/atomic" 


) 


var total uint64 


func worker(wg *sync.WaitGroup) { 
defer wg.Done() 


var i uint64 
for i = 0; i <= 100; i++ ( 
atomic .AddUint64(&total, i) 


} 


func main() { 
var wg sync.WaitGroup 
wg.Add(2) 


go worker(&wg) 
go worker(&wg) 
wg.Wait() 


atomic.AddUinte4 函数 调用 保证 了 total 的 读 取 、 更 新 和 保存 是 一 个 原子 操作 ， 因 此 在 多 线 
程 中 访问 也 是 安全 的 。 


原子 操作 配合 互 斥 锁 可 以 实现 非常 高 效 的 单 件 模式 。 互 斥 锁 的 代价 比 普通 整数 的 原子 读 写 高 
很 多 ， 在 性 能 敏感 的 地 方 可 以 增加 一 个 数字 型 的 标志 位 ， 通 过 原子 检测 标志 位 状态 降低 互 斤 
锁 的 使 用 次 数 来 提高 性 能 。 


type singleton struct {} 


var ( 
instance *singleton 
initialized uint32 
mu sync.Mutex 


func Instance() *singleton { 
if atomic.LoadUint32(&initialized) -- 1 ( 
return instance 


mu.Lock() 
defer mu.Unlock() 


if instance == nil { 
defer atomic.StoreUint32(&initialized, 1) 
instance = &singleton{} 


} 


return instance 


我 们 可 以 将 通用 的 代码 提取 出 来 ， 就 成 了 标准 库 中 sync.once 的 实现 : 


type Once struct { 
m Mutex 
done uint32 


func (o *Once) Do(f func()) { 
if atomic.LoadUint32(&o.done) == 1 ( 
return 


o.m.Lock() 
defer o.m.Unlock() 
if o.done == 0 ( 


defer atomic.StoreUint32(&o.done, 1) 


f() 


基于 sync.once 重新 实现 单 件 模式 : 


var ( 
instance *singleton 
once sync.Once 


func Instance() *singleton { 
once.Do(func() 1 
instance = &singleton{} 


}) 


return instance 


sync/atomic 包 对 基本 的 数值 类 型 及 复杂 对 象 的 读 写 都 提供 的 支 
持 。 atomic.Value 原子 对 象 提供 了 Load 和 store 两 个 原子 方法 ， 分 别 用 于 加 载 和 保存 数 
据 ， 返回 值 和 参数 都 是 interface{} 类 型 ， 因此 可 以 用 于 任意 的 自 TM 9 


var config atomic.Value // 保存 当前 配置 信息 


// 初始 化 配置 信息 
config.Store(loadConfig()) 


// 启动 一 个 后 台 线程 ， 加 载 更 新 后 的 配置 信息 
go func() { 
for 1 


time.Sleep(time.Second) 
config.Store(loadConfig()) 


// 用 于 处 理 请 求 的 工作 者 线程 始终 采用 最 新 的 配置 信息 
fori c= 0 gr cb T 
go func() (1 
for r := range requests() { 
c := config.Load() 
ET 


T6) 


这 是 一 个 简化 的 生产 者 、 消 费 者 模型 : 后 台 线 程 生成 最 新 的 配置 信息 ; 前 台 多 个 工作 者 线程 
获取 最 新 的 配置 信息 。 所 有 线程 共享 配置 信 


顺序 一 致 性 内 存 模 型 


如 果 只 是 想 简 单 地 在 线程 之 间 进 行 数据 同步 的 话 ， 原 子 操作 已 经 为 编程 人 员 提 供 了 一 些 同 步 
保障 。 不 过 这 种 保障 有 一 个 前 提 : 顺序 一 致 性 的 内 存 模型 。 要 了 解 顺序 一 致 性 ， 我 们 先 看 看 
一 个 简单 的 例子 : 


var a string 
var done bool 


func setup() { 
a = "hello, world" 
done - true 


} 

func main() { 
go setup() 
for !done {} 
print(a) 


我 们 创建 了 setup 线程 ， 用 于 对 字符 串 a 的 初始 化 工作 ， 初 始 化 完成 之 后 设置 done 标志 
为 true 。 main 函数 所 在 的 主线 程 中 ， 通过 for !done ü 检测 done 变 为 true 时 ， 认 为 字 
符 串 初始 化 工作 完成 ， 然 后 进行 字符 串 的 打印 工作 。 


但 是 Go 语言 并 不 保证 在 main 函数 中 观测 到 的 对 done 的 写 入 操作 发 生 在 对 字符 串 a 的 写 入 
的 操作 之 后 ， 因 此 程序 很 可 能 打印 一 个 空 字符 串 。 更 糟 糕 的 是 ， 因 为 两 个 线程 之 间 没 有 同步 
事件 ， setup 线程 对 done 的 写 入 操作 甚至 无 法 被 main 线程 看 到 ， main 函数 有 可 能 陷入 死 
循环 中 。 


在 Go 语言 中 ， 同 一 个 Goroutine 线 程 内 部 ， 顺 序 一 致 性 内 存 模型 是 得 到 保证 的 。 但 是 不 同 的 
Goroutine 之 间 ， 并 不 满足 顺序 一 致 性 内 存 模型 ， 需 要 通过 明确 定义 的 同步 事件 来 作为 同步 的 
参考 。 如 果 两 个 事件 不 可 排序 ， 那 么 就 说 这 两 个 事件 是 并 发 的 。 为 了 最 大 化 并 行 ，Go 语 言 的 
编译 器 和 处 理 器 在 不 影响 上 述 规 定 的 前 提 下 可 能 会 对 执行 语句 重新 排序 (CPU 也 会 对 一 些 指 
令 进 行 乱 序 执行 ) 。 


因此 ， 如 果 在 一 个 Goroutine 中 顺序 执行 a= 1; b = 2; 两 个 语句 ， 虽 然 在 当前 的 Goroutine 中 
可 以 认为 a = 1; 语句 先 于 b = 2; 语句 执行 ， 但 是 在 另 一 个 Goroutine 中 p = 2; 语句 可 能 会 

AT a = 1; 语句 执行 ， 基 至 在 另 一 个 Goroutine 中 无 法 看 到 它们 的 变化 (可 能 始终 在 寄存 器 

T) 。 也 就 是 说 在 另 一 个 Goroutine 看 来 ，a = 1; b = 2; 两 个 语句 的 执行 顺序 是 不 确定 的 。 如 
果 一 个 并 发 程序 无 法 确定 事件 的 偏 序 关系 ， 那 么 程序 的 运行 结果 往往 会 有 不 确定 的 结果 。 比 

如 下 面 这 个 程序 : 


func main() { 
go println(" 你 好 ， 世 界 " ) 
} 


根据 Go 语言 规范 ，main 函数 退出 时 程序 结束 ， 不 会 等 待 任何 后 台 线 程 。 因 为 Goroutine 的 执 
行 和 main 函数 的 返回 事件 是 并 发 的 ， 谁 都 有 可 能 先 发 生 ， 所 以 什么 时 候 打 印 ， 能 否 打 印 都 是 
未 知 的 。 


用 前 面 的 原子 操作 并 不 能 解决 问题 ， 因 为 我 们 无 法 确定 两 个 原子 操作 之 间 的 顺序 。 解 决 问题 
的 办 法 就 是 通过 同步 原 语 来 给 两 个 事件 明确 排序 : 


func main() { 
done :- make(chan int) 


go func()1 
printLn(" 你 好 ， 世 界 " ) 
done <- 工 


}() 


<-done 


当 <-done 执行 时 ， 必 然 要 求 done <- 1 也 已 经 执行 。 根 据 同 一 个 Gorouine 依 然 满 足 顺序 一 致 
性 规则 ， 我 们 可 以 判断 当 done <- 1 执行 时 ， println(" 你 好 ， 世 界 ") 语句 必然 已 经 执行 完成 
了 。 因 此 ， 现 在 的 程序 确保 可 以 正常 打印 结果 。 


当然 ， 通 过 sync.Mutex 互 矿 量 也 是 可 以 实现 同步 的 : 


func main() { 
var mu sync.Mutex 


mu.Lock() 

go func()1 
println(" 你 好 ， 上 世界 ") 
mu.Unock() 


}() 


mu.Lock() 


可 以 确定 后 台 线 程 的 mu.Unock() 必然 在 println(" 你 好 ， 志 界 ") 完成 后 发 生 (同一 个 线程 满足 
顺序 一 致 性 ) > main 哆 数 的 第 二 个 mu.Lock() 必然 在 后 人 台 线 程 的 mu.Unock() 之 后 发 生 
( sync.Mutex 保证 ) ， 此 时 后 台 线 程 的 打印 工作 已 经 顺利 完成 了 。 


初始 化 顺序 


前 面 函 数 章节 中 我 们 已 经 简单 介绍 过 程序 的 初始 化 顺序 ， 这 是 属于 Go 语言 面向 并 发 的 内 存 模 
型 的 基础 规范 。 


Go 程序 的 初始 化 和 执行 总 是 从 main.main 哆 数 开始 的 。 但 是 如 果 main 包 里 导入 了 其 它 的 

包 ， 则 会 按照 顺序 将 它们 包含 进 main 包 里 (这 里 的 导入 顺序 依赖 具体 实现 ， 一 般 可 能 是 以 文 
件 名 或 包 路 径 名 的 字符 串 顺序 导入 ) 。 如 果菜 个 包 被 多 次 导入 的 话 ， 在 执行 的 时 候 只 会 导入 

一 次 。 当 一 个 包 被 导入 时 ， 如 果 它 还 导入 了 其 它 的 包 ， 则 先 将 其 它 的 包 和 包含 进来 ， 然 后 创建 

和 初始 化 这 个 包 的 常量 和 变量 。 然 后 就 是 调用 和 包 里 的 init 有 函数 ， 如 果 一 个 乌有 多 个 init fh 
数 的 话 ， 实 现 可 能 是 以 文件 名 的 顺序 调用 ， 同 一 个 文件 内 的 多 个 init 则 是 以 出 现 的 顺序 依次 
调用 ( init 不 是 普通 函数 ， 可 以 定义 有 多 个 ， 所 以 不 能 被 其 它 函 数 调 用 ) 。 最 终 ， 

在 main 包 的 所 有 包 常 量 、 包 变量 被 创建 和 初始 化 ， 并 且 init 子 数 被 执行 后 ， 才 会 进 

入 main.main 哆 数 ， 程 序 开始 正常 执行 。 下 图 是 Go 程序 函数 启动 顺序 的 示意 图 : 

















pkgl pkg2 
-» import pkgl import pkg2 import pkg3 


const ... COnSE sa 


init() 
" 


main() 





要 注意 的 是 ， 在 main.main 元 数 执 行 之 前 所 有 代码 都 运行 在 同一 个 goroutine 中 ， 也 是 运行 在 
程序 的 主 系统 线程 中 。 如 果 某 个 init 函数 内 部 用 go 关键 字 启 动 了 新 的 goroutine 的 话 ， 新 的 
goroutine ^ 有 在 进入 main.main 遂 数 之 后 才 可 能 被 执行 到 。 


因为 所 有 的 init Hie main 兄 数 都 是 在 主线 程 完 成 ， 它 们 也 是 满足 顺序 一 致 性 模型 的 。 


Goroutine 的 创建 
go 语句 会 在 当前 Goroutine 对 应 函数 返回 前 创建 新 的 Goroutine. 例如 : 


var a string 


func f() € 
print(a) 
} 


func hello() { 
a = "hello, world" 
go f() 


执行 go FO 语句 创建 Goroutine 和 hello 函数 是 在 同一 个 Goroutine 中 执行 , 根据 语句 的 书写 
顺序 可 以 确定 Goroutine 的 创建 发 生 在 hello 函数 返回 之 前 , 但 是 新 创建 Goroutine 对 应 

的 FO 的 执行 事件 和 hello 函数 返回 的 事件 则 是 不 可 排序 的 ， 也 就 是 并 发 的 。 调 用 hello 可 
能 会 在 将 来 的 某 一 时 刻 打印 "hello, world" ， 也 很 可 能 是 在 hello 函数 执行 完成 后 才 打 印 。 


基于 Channel 的 通信 


Channel 通 信 是 在 Goroutine 之 间 进 行 同步 的 主要 方法 。 在 无 缓存 的 Channel 上 的 每 一 次 发 送 操 
作 都 有 与 其 对 应 的 接收 操作 相配 对 ， 发 送 和 接收 操作 通常 发 生 在 不 同 的 Goroutine 上 (在 同一 
个 Goroutine 上 执行 2 个 操作 很 容易 导致 死 锁 ) 。 无 缓存 的 Channel 上 的 发 送 操作 总 在 对 应 的 接 
收 操作 完成 前 发 生 . 


var done = make(chan bool) 
var msg string 


func aGoroutine() { 
msg = "RE, EF" 
done <- true 


} 


func main() { 
go aGoroutine() 
«-done 
println(msg) 


A 


可 保证 打印 出 “hello, world”。 该 程序 首先 对 msg 进行 写 入 ， 然 后 在 done 管道 上 发 送 同步 信 
号 ， 随 后 从 done 接收 对 应 的 同步 言 号 ， 最 后 执行 println 函数 。 


若 在 关闭 信道 后 继续 从 中 接收 数据 ， 接 收 者 就 会 收 到 该 信道 返回 的 零 值 。 因 此 在 这 个 例子 
TH close(c) 关闭 管道 代替 done <- false 依然 能 保证 该 程序 产生 相同 的 行为 。 


var done = make(chan bool) 
var msg string 


func aGoroutine() { 
msg = "你 好 ， 世 界 " 
close(done) 


j 


func main() { 
go aGoroutine() 
«-done 
println(msg) 


对 于 从 无 缓冲 信道 进行 的 接收 ， 发 生 在 对 该 信道 进行 的 发 送 完成 之 前 。 


基于 上 面 这 个 规则 可 知 ， 交 换 两 个 Goroutine 中 的 接收 和 发 送 操作 也 是 可 以 的 (但 是 很 危 
E) 


var done - make(chan bool) 
var msg string 


func aGoroutine() { 
msg - "hello, world" 
«-done 


} 

func main() { 
go aGoroutine() 
done «- true 
println(msg) 


也 可 保证 打印 出 “hello, world" » AA main 线程 中 done <- true. 发 送 完成 前 ， 后 台 线 程 <- 
done ee ， 这 保证 msg = "hello, world" 被 执行 了 ， 所 以 之 后 println(msg) 的 msg 
已 经 被 赋值 过 了 。 简 而 言 之 ， 后 人 台 线 程 首 先 对 msg 进行 写 入 ， 然 后 从 done 中 接收 信号 ， 随 
后 main done 发 送 对 应 的 信号 ， 最 后 执行 println 函数 完成 。 但 是 ， 若 该 信道 为 带 缓 
冲 的 (例如 * done = make(chan bool, 1) ) ^ main 线程 的 done «- true 接收 操作 将 不 会 被 
后 全 线程 的 <-done 接收 操作 阻塞 ， 该 程序 将 无 法 保证 打印 出 "hello, world” ° 


对 于 带 缓 冲 的 Channel， 对 于 Channel 的 第 x 个 接收 完成 操作 发 生 在 第 ke 个 发 送 操作 完成 
之 前 ， 其 中 c 是 Channel 的 缓存 大 小 。 如 果 将 c 设置 为 0 自然 就 对 应 无 缓存 的 Channel， 也 
即使 第 K 个 接收 完成 在 第 K 个 发 送 完 成 之 前 。 因 为 无 缓存 的 Channel 只 能 同步 发 1 个 ， 也 就 简化 
为 前 面 无 缓存 Channel 的 规则 : 对 于 从 无 缓冲 信道 进行 的 接收 ， 发 生 在 对 该 信道 进行 的 发 送 完 
成 之 前 。 


我 们 可 以 根据 控制 Channel 的 缓存 大 小 来 控制 并 发 执行 的 Goroutine 的 最 大 数目 , 例如 


var limit = make(chan int, 3) 


func main() { 
for _, w := range work ( 
go func() (1 
limit <- 1 
w() 
«-limit 
}() 
} 
select{} 


3/6 — 6] select() 是 一 个 空 的 管道 选择 语句 ， 该 语句 会 导致 main 线程 阻塞 ， 从 而 避免 程序 
过 早退 出 。 还 有 for() ^ «-make(chan int) 等 诸多 方法 可 以 达到 类 似 的 效果 。 因 为 main 线程 
被 阻塞 了 ， 如 果 需 要 程序 正常 退出 的 话 可 以 通过 调用 os.Exit(o) 实现 。 


不 靠 谱 的 同步 


前 面 我 们 已 经 分 析 过 ， 下 面 代码 无 法 保证 正常 打印 结果 。 实 际 的 运行 效果 也 是 大 概率 不 能 
常 输出 结果 。 


func main() { 
go println(" 你 好 ， 世 界 ") 
} 


刚 接触 Go 语言 的 话 ， 可 能 希望 通过 加 入 一 个 随机 的 休眠 时 间 来 保证 正常 的 输出 : 


func main() { 
go println("hello, world") 
time.Sleep(time.Second) 


因为 主线 程 体 眠 了 1 秒 钟 ， 因 此 这 个 程序 大 概率 是 可 以 正常 输出 结果 的 。 因 此 ， 很 多 人 会 觉得 

这 个 程序 已 经 没有 问题 了 。 但 是 这 个 程序 是 不 稳健 的 ， 依 然 有 失败 的 可 能 性 。 我 们 先 假设 程 

序 是 可 以 稳定 输出 结果 的 。 因 为 Go 线程 的 启动 是 非 阻塞 的 ， main 线程 显 式 休眠 了 1 秒 钟 退出 

导致 程序 结束 ， 我 们 可 以 近似 地 认为 程序 总 共 执 行 了 1 秒 多 时 间 。 现 在 假设 println 函数 内 部 

RM 间 大 于 main 线程 休眠 的 时 间 的 话 ， 就 会 导致 矛盾 : 后 台 线 程 既 然 先 于 main AX 
完成 打印 ， 那 么 执行 时 间 肯 定 是 小 于 main 线程 执行 时 间 的 。 当 然 这 是 不 可 能 的 。 


严谨 的 并 发 程序 的 正确 性 不 应 该 是 依赖 于 CPU 的 执行 速度 和 休眠 时 间 等 不 靠 谱 的 因素 的 。 严 
谨 的 并 发 也 应 该 是 可 以 静态 推导 出 结果 的 : 根据 线程 内 顺序 一 致 性 ， 结 合 Channel 或 sync 同 
步 事 件 的 可 排序 性 来 推导 ， 最 终 完 成 各 个 线程 各 段 代 码 的 偏 序 关 系 排序 。 如 果 两 个 事件 无 法 
根据 此 规则 来 排序 ， 那 么 它们 就 是 并 发 的 ， 也 就 是 执行 先后 顺序 不 可 靠 的 。 


解决 同步 问题 的 思路 是 相同 的 : 使 用 显 式 的 同步 


1.6. 常见 的 并 发 模式 


Go 语言 最 吸引 人 的 地 方 是 它 内 建 的 并 发 支持 。Go 语 言 并 发 体系 的 理论 是 C.A.R Hoare 在 1978 
年 提出 的 CSP (Communicating Sequential Process， 通 讯 顺序 进程 ) 。CSP 有 着 精确 的 数 
学 模型 ， 并 实际 应 用 在 了 Hoare 参 与 设计 的 T9000 通用 计算 机 上 。 从 NewSqueak、Alef、 
Limbo 到 现在 的 Go 语言 ， 对 于 对 CSP 有 着 20 多 年 实战 经 验 的 Rob Pike 来 说 ， 他 更 关注 的 是 将 
CSP 应 用 在 通用 编程 语言 上 的 潜力 。 作 为 Go 并 发 编程 核心 的 CSP 理 论 的 核心 概念 只 有 一 个 : 
同步 通信 。 关 于 同步 通信 的 话题 我 们 在 前 面 一 节 已 经 讲 过 ， 本 节 我 们 将 简单 介绍 下 Go 语言 中 
常见 的 并 发 模式 。 


首先 要 明确 一 个 概念 : 并 发 不 是 并 行 。 并 发 更 关注 的 是 程序 的 设计 层面 ， 并 发 的 程序 完全 是 
可 以 顺序 执行 的 ， 只 有 在 昌 正 的 多 核 CPU 上 才 可 能 睦 正 地 同时 运行 。 并 行 更 关注 的 是 程序 的 
运行 层面 ， 并 行 一 般 是 简单 的 大 量 重复 ， 例 如 GPU 中 对 图 像 处 理 都 会 有 大 量 的 并 行 运 算 。Go 
语言 从 一 开始 设计 ， 就 围绕 着 如 何 能 在 编程 语言 的 层级 ， 为 更 好 的 编写 并 发 程序 设计 一 个 简 
洁 安 全 高 效 的 抽象 模型 ， 让 程序 员 专注 于 分 解 问题 和 组 合 方案 ， 而 且 不 用 被 线程 管理 和 信号 
互 太 这 些 繁琐 的 操作 分 散 精力 。 


在 并 发 编程 中 ， 对 共享 资源 的 正确 访问 需要 精确 的 控制 ， 在 目前 的 绝 大 多 数 语 言 中 ， 都 是 通 
过 加 锁 等 线程 同步 方案 来 解决 这 一 困难 问题 ， 而 Go 语言 却 另 凡 蹊 径 ， 它 将 共享 的 值 通过 信道 
传递 (实际 上 多 个 独立 执行 的 线程 很 少 主动 共享 资源 )。 在 任意 给 定 的 时 刻 ， 最 好 只 有 一 个 
Goroutine 能 够 拥有 该 资源 。 数 据 竞 争 从 设计 层面 上 就 被 杜绝 了 。 为 了 提倡 这 种 思考 方式 ，Go 
语言 将 其 并 发 编程 哲学 化 为 一 名 口号 : 


Do not communicate by sharing memory; instead, share memory by communicating. 
不 要 通过 共享 内 存 来 通信 ， 而 应 通过 通信 来 共享 内 存 。 


这 是 更 高 层次 的 并 发 编程 哲学 (通过 管道 来 传 值 是 Go 语言 推荐 的 做 法 )。 虽 然 像 引用 计数 这 类 
简单 的 并 发 问题 通过 原子 操作 或 互 斥 锁 就 能 很 好 地 实现 ， 但 是 通过 信道 来 控制 访问 能 够 让 你 
写 出 更 简洁 正确 的 程序 。 


并 发 版 本 的 Hello world 


我 们 先 以 在 一 个 新 的 Goroutine 中 输出 “Hello world” > main 等 待 后 台 线 程 输出 工作 完成 之 后 退 
出 ， 这 样 一 个 简单 的 并 发 程序 作为 热身 。 

并 发 编程 的 核心 概念 是 同步 通信 ， 但 是 同步 的 方式 却 有 多 种 。 我 们 先 以 大 家 熟悉 的 互 斤 

È sync.Mutex 来 实现 同步 通信 。 根 据 文档 ， 我 们 不 能 直接 对 一 个 未 加 锁 状 态 的 sync.Mutex 进 
行 解锁 ， 这 会 导致 运行 时 异常 。 下 面 这 种 方式 并 不 能 保证 正常 工作 : 


func main() { 
var mu sync.Mutex 


go func(){ 
fmt.Println("4k4f, 7") 
mu.Lock() 

}() 


mu.Unlock() 


因为 mu.Lock() 和 mu.unlock() 并 不 在 同一 个 Goroutine 中 ， 所 以 也 就 不 满足 顺序 一 致 性 内 存 
模型 。 同 时 它们 也 没有 其 它 的 同步 事件 可 以 参考 ， 这 两 个 事件 不 可 排序 也 就 是 可 以 并 发 的 。 
因为 可 能 是 并 发 的 事件 ， 所 以 main 函数 中 的 mu.unlock() 很 有 可 能 先 发 生 ， 而 这 个 时 

刻 mu 互 太 对象 还 处 于 未 加 锁 的 状态 ， 从 而 会 导致 运行 时 异常 。 


下 面 是 修复 后 的 代码 : 


func main() { 
var mu sync.Mutex 


mu.Lock() 

go func(){ 
fmt.Println('4p4f, +R") 
mu .Unlock() 

}() 


mu.Lock() 


修复 的 方式 是 在 main 函数 所 在 线程 中 执行 两 次 mu.Lock() ， 当 第 二 次 加 锁 时 会 因为 锁 已 经 被 
占用 (不 是 北 归 锁 ) 而 阻塞 ， main 函数 的 阻塞 状态 驱动 后 台 线 程 继 续 向 前 执行 。 当 后 台 线 程 
执行 到 mu.unlock() 时 解锁 ， 此 时 打印 工作 已 经 完成 了 ， 解 锁 会 导致 main HAP 9 $S— 

个 mu.Lock() 阻塞 状态 取消 ， 此 时 后 台 线 程 和 主线 程 再 没有 其 它 的 同步 事件 参考 ， 它 们 退出 
的 事件 将 是 并 发 的 :在 main 函数 退出 导致 程序 退出 时 ， 后 台 线 程 可 能 已 经 退出 了 ， 也 可 能 没 
有 退出 。 虽 然 无 法 确定 两 个 线程 退出 的 时 间 ， 但 是 打印 工作 是 可 以 正确 完成 的 。 


使 用 sync.Mutex 互 斥 锁 同步 是 比较 低级 的 做 法 。 我 们 现在 改 用 无 缓存 的 管道 来 实现 同步 : 


func main() { 
done := make(chan int) 


go func()( 
fmt.Println("4R4f, 7") 
«-done 


}() 


done <- 1 


根据 Go 语言 内 存 模型 规范 ， 对 于 从 无 缓冲 信道 进行 的 接收 ， 发 生 在 对 该 信道 进行 的 发 送 完 成 
之 前 。 因 此 ， 后 台 线 程 <-done 接收 操作 完成 之 后 ” main 线程 的 done <- 1 发 生 操 作 才 可 能 
完成 〈 从 而 退出 main、 退 出 程序 ) ， 而 此 时 打印 工作 已 经 完成 了 。 


上 面 的 代码 虽然 可 以 正确 同步 ， 但 是 对 管道 的 缓存 大 小 太 敏感 : 如 果 管 道 有 缓存 的 话 ， 就 无 
法 保证 能 main 退 出 之 前 后 台 线 程 能 正常 打印 了 。 更 好 的 做 法 是 将 管道 的 发 送 和 接收 方向 调换 
一 下 ， 这 样 可 以 避免 同步 事件 受 管道 缓存 大 小 的 影响 : 


func main() { 


done := make(chan int, 1) // 带 缓存 的 管道 
go func()1 
fmt.Println('4p4f, +R") 
done «- 1 
30 
«-done 


对 于 带 缓冲 的 Channel， 对 于 Channel 的 第 K 个 接收 完成 操作 发 生 在 第 K+C 个 发 送 操 作 完 成 之 
前 ， 其 中 C 是 Channel 的 缓存 大 小 。 虽 然 管道 是 带 缓存 的 ， min 线程 接收 完成 是 在 后 台 线 程 
发 送 开始 但 还 未 完成 的 时 刻 ， 此 时 打印 工作 也 是 已 经 完成 的 。 


基于 带 缓存 的 管道 ， 我们 可 以 很 容易 将 打印 线程 扩展 到 NN 个 。 下 面 的 例子 是 开启 10 个 后 人 台 线 程 
T 别 打印 : 


func main() { 


done := make(chan int, 10) // 'k 10 个 缓存 
// 开 N 个 后 台 打 印 线程 
for i:-2 0; i « cap(done); i--* ( 
go func()( 
fmt .Println(" 你 好 ， 世 界 ") 
done <- 1 
}() 
} 
// 等 待 N 个 后 台 线 程 完成 
for i :-2 0; i « cap(done); Itt ( 
«-done 
} 


对 于 这 种 要 等 待 N 个 线程 完成 后 再 进行 下 一 步 的 同步 操作 有 一 个 简单 的 做 法 ， 就 是 使 
用 sync.waitGroup 来 等 待 一 组 事件 : 


func main() { 
var wg sync.WaitGroup 


// 开 N 个 后 台 打 印 线程 
for i:-0;i« 10; it* ( 
wg .Add(1) 
go func (9m C 
fmt .Println(" 你 好 ， 世 界 ") 
wg.Done() 
}() 
} 


// 等 待 N 个 后 台 线 程 完成 
wg .Wait() 


其 中 wg.Add(i) 用 于 增加 等 待 事件 的 个 数 ， 必 须 确保 在 后 人 台 线 程 启动 之 前 执行 (如 果 放 到 后 
台 线 程 之 中 执行 则 不 能 保证 被 正常 执行 到 ) 。 当 后 台 线 程 完成 打印 工作 之 后 ， 调 
用 wg.Done() 表示 完成 一 个 事件 。 main 函数 的 wg.wait() 是 等 待 全 部 的 事件 完成 。 


生产 者 消费 者 模型 


并 发 编程 中 最 常见 的 例子 就 是 生产 者 /消费 者 模式 ， 该 模式 主要 通过 平衡 生产 线程 和 消费 线程 
的 工作 能 力 来 提高 程序 的 整体 处 理 数据 的 速度 。 简 单 地 说 ， 就 是 生产 者 生产 一 些 数据 ， 然 后 
放 到 成 果 队 列 中 ， 同 时 消费 者 从 成 果 队 列 中 来 取 这 些 数据 。 这 样 就 让 生产 消费 变 成 了 异步 的 


两 个 过 程 。 当 成 果 队 列 中 没有 数据 时 ， 消 费 者 就 进入 饥 饭 的 等 待 中 ; 而 当成 果 队 列 中 数据 已 
满 时 ， 生 产 者 则 面临 因 产 品 挤 压 导致 CPU 被 剥夺 的 下 岗 问 题 。 


Go 语言 实现 生产 者 消费 者 并 发 很 简单 : 





// 生产 者 : 生成 factor 整数 倍 的 序列 
func Producer(factor int, out chan<- int) { 
OM = 
out <- i*factor 


// 消费 者 
func Consumer(in «-chan int) { 
for v := range in { 
fmt.Println(v) 


} 


func main() { 
ch := make(chan int, 64) // 成 果 队 列 


成 3 的 倍数 的 序列 


go Producer(3, ch) // & 
go Producer(5, ch) // 生成 5 的 倍数 的 序列 


go Consumer(ch) // 消费 生成 的 队列 


// 运行 一 定时 间 后 退出 


time.Sleep(5 * time.Second) 


我 们 开启 了 2 个 producer 生产 流水 线 ， 分 别 用 于 生成 3 和 5 的 倍数 的 序列 。 然 后 开启 1 

个 consumer 消 费 者 线程 * 4T 印 获取 的 结果 9 我 们 通过 在 main E XR BA — E 8g 时 间 来 让 生产 
者 和 消费 者 工作 一 定时 间 。 正 如 前 面 一 节 说 的 ， 这 种 靠 休眠 方式 是 无 法 保证 稳定 的 输出 结果 
的 。 


我 们 可 以 让 main 哆 数 保存 阻塞 状态 不 退出 ， 只 有 当 用 户 输入 ctrl-c 时 才 申 正 退 出 程序 : 


func main() { 
ch := make(chan int, 64) // 成 果 队 列 


go Producer(3, ch) // 4 
go Producer(5, ch) // 
go Consumer(ch) // i 





// Ctrl«C REE 

sig :- make(chan os.Signal, 1) 

signal.Notify(sig, syscall.SIGINT, syscall.SIGTERM) 
fmt.Printf("quit (%v)\n", «-sig) 


我 们 这 个 例子 中 有 2 个 生产 者 ， 并 且 2 个 生产 者 之 间 并 无 同步 事件 可 参考 ， 它 们 是 并 发 的 。 
此 ， 消 费 者 输出 的 结果 序列 的 顺序 是 不 确定 的 ， 这 并 没有 问题 ， 生 产 者 和 消费 者 依然 可 以 相 
互 配合 工作 。 


发 布 订 阅 模型 


A / ir] (publish-and-subscribe) 模型 通常 被 简写 为 pubsub 模 型 。 在 这 个 模型 中 ， 消 
息 生 产 者 成 为 发 布 者 (publisher) ， 而 消息 消费 者 则 称 对 应 订阅 者 (subscriber) ， 生 产 者 和 
消费 者 是 M : N 的 关系 。 在 传统 生产 者 和 消费 者 模型 中 ， 成 果 是 将 消息 发 送 到 一 个 队列 中 ， 而 
发 布 /订阅 模型 则 是 将 消息 发 布 给 一 个 主题 。 


为 此 ， 我 们 构建 了 一 个 名 为 pubsub 的 发 布 订阅 模型 支持 包 : 


// Package pubsub implements a simple multi-topic pub-sub library. 
package pubsub 





import ( 
USVIICA 
"time" 
) 
type ( 
subscriber chan interface() // 订阅 者 为 一 个 管道 
topicFunc func(v interface{}) bool // 主题 为 一 个 过 滤器 
) 
// 发 布 者 对 象 
type Publisher struct { 
m sync.RWMutex // 读 写 锁 
buffer int // iT IAEA 





timeout time.Duration // 发 布 超时 时 站 


subscribers map[subscriber]topicFunc // 订阅 者 信息 





// 构建 一 个 发 布 者 对 象 ， 可 以 设置 发 布 起 时 时 间 和 缓存 队列 的 长 度 
func NewPublisher(publishTimeout time.Duration, buffer int) *Publisher { 
return &Publisher( 


buffer: buffer, 
timeout: publishTimeout, 
subscribers: make(map[subscriber]topicFunc), 
à 
H 
// 添加 一 个 新 的 订阅 者 ， 订 阅 全 部 主题 


func (p *Publisher) Subscribe() chan interface{} 1 
return p.SubscribeTopic(nil) 


m 


第 选 后 的 主题 






// 添加 一 个 新 的 订阅 者 ， 订 阅 过 滤器 
func (p *Publisher) SubscribeTopic(topic topicFunc) chan interface() { 
ch := make(chan interface(j, p.buffer) 
p.m.Lock() 
p.subscribers[ch] = topic 
p.m.Unlock() 
return ch 


// 退出 订阅 

func (p *Publisher) Evict(sub chan interface([)) 1 
p.m.Lock() 
defer p.m.Unlock() 


delete(p.subscribers, sub) 
close(sub) 


// EAp—^- 37H 

func (p *Publisher) Publish(v interface(3) 1 
p.m.RLock() 
defer p.m.RUnlock() 


var wg sync.WaitGroup 





for sub, topic := range p.subscribers { 
wg.Add(1) 
go p.sendTopic(sub, topic, v, &wg) 
} 
wg.Wait() 
H 
// 关闭 发 布 者 对 象 ， 同 时 关闭 所 有 的 订阅 者 
func (p *Publisher) Close() { 
p.m.Lock( ) 
defer p.m.Unlock() 
for sub := range p.subscribers { 
delete(p.subscribers, sub) 
close(sub) 
} 
} 
// 发 送 主题 ， 可 以 容忍 一 定 的 超时 


func (p *Publisher) sendTopic(sub subscriber, topic topicFunc, v interface{}, wg *sync.Wa 
defer wg.Done() 
if topic !- nii && !topic(v) { 
return 


select { 
case sub «- v: 
case «-time.After(p.timeout): 


} 


} 





«| 
下 面 的 例子 中 ， 有 两 个 订阅 者 分 别 订 阅 了 全 部 主题 和 含有 "golang" 的 主题 : 





import "path/to/pubsub" 


func main() { 
p := pubsub.NewPublisher(i00*time.Millisecond, 16) 


defer p.Close() 


all :- p.Subscribe() 
golang := p.SubscribeTopic(func(v interface{}) bool { 
if s, ok :- v.(string); ok ( 
return strings.Contains(s, "golang") 


} 


return false 


}) 


p.Publish("hello, world!") 
p.Publish("hello, golang!") 


go func() { 
for msg := range all { 
fmt.Println("all:", msg) 


J; 

} () 

go func() { 
for msg := range golang { 

fmt.Println("golang:", msg) 

} 

ha 

// 运行 一 定时 间 后 退出 


time.Sleep(3 * time.Second) 


在 发 布 订阅 模型 中 ， 每 条 消息 都 会 传送 给 多 个 订阅 者 。 发 布 者 通常 不 会 知道 、 也 不 关心 哪 一 
个 订阅 者 正在 接收 主题 消息 。 订 阅 者 和 发 布 者 可 以 在 运行 时 动态 添加 是 一 种 松散 的 粗 合 关 
心 ， 这 使 得 系统 的 复杂 性 可 以 随时 间 的 推移 而 增长 。 在 现实 生活 中 ， 不 同城 市 的 象 天 气 预 报 
之 类 的 应 用 就 可 以 应 用 这 个 并 发 模式 。 


启 者 为 王 


采用 并 发 编程 的 动机 有 很 多 : 并 发 编程 可 以 简化 问题 ， 比 如 一 类 问题 对 应 一 个 处 理 线 程 会 更 
简单 ; 并 发 编程 还 可 以 提升 性 能 ， 在 一 个 多 核 CPU 上 开 2 个 线程 一 般 会 比 开 1 个 线程 快 一 些 。 
其 实 对 于 提升 性 能 而 言 ， 程 序 并 不 是 简单 地 运行 速度 快 就 表示 用 户 体 验 好 的 ; 很 多 时 候 程序 
能 快速 响应 用 户 请 求 才 是 最 重要 的 ， 当 没有 用 户 请 求 需要 处 理 的 时 候 才 合适 处 理 一 些 低 优先 
级 的 后 台 任 务 。 


假设 我 们 想 快 速 地 检索 "golang" 相 关 的 主题 ， 我 们 可 能 会 同时 打开 Bing、Google 或 百度 等 多 个 
检索 引擎 。 当 某 个 检索 最 先 返回 结果 后 ， 就 可 以 关闭 其 它 检索 页 面 了 。 因 为 受 限 于 网 络 环境 
和 检索 引擎 算 法 的 影响 ， 某 些 检索 引擎 可 能 很 快 返回 检索 结果 ， 某 些 检索 引擎 也 可 能 遇 到 等 
到 他 们 公司 倒闭 也 没有 完成 检索 的 情况 。 我 们 可 以 采用 类 似 的 策略 来 编写 这 个 程序 : 


func main() { 


ch := make(chan string, 32) 
go func() { 
ch «- searchByBing("golang") 
} 
go func() { 
ch <- searchByGoogle("golang") 
} 
go func() 1 
ch <- searchByBaidu("golang") 
} 


fmt.Println(«-ch) 


首先 ， 我 们 创建 了 一 个 带 缓存 的 管道 ， 管 道 的 缓存 数目 要 足够 大 ， 保 证 不 会 因为 缓存 的 容量 
引起 不 必要 的 阻塞 。 然 后 我 们 开启 了 多 个 后 台 线 程 ， 分 别 向 不 同 的 检索 引擎 提交 检索 请 求 。 
当 任 意 一 个 检索 引擎 最 先 有 结果 之 后 ， 都 会 马上 将 结果 发 到 管道 中 (因为 管道 带 了 足够 的 缓 
存 ， 这 个 过 程 不 会 阻塞 ) 。 但 是 最 终 我 们 只 从 管道 取 第 一 个 结果 ， 也 就 是 最 先 返 回 的 结果 。 


通过 适当 开局 一 些 宛 余 的 线程 ， 党 试用 不 同 途径 去 解决 同样 的 问题 ， 最 终 以 赢 者 为 王 的 方式 
提升 了 程序 的 相应 性 能 


o 


控制 并 发 数 


很 多 用 户 在 适应 了 Go 语言 强大 的 并 发 特性 之 后 ， 都 倾向 于 编写 最 大 并 发 的 程序 ， 因 为 这 样 似 
乎 可 以 提供 最 大 的 性 能 。 在 现实 中 我 们 行 色 匆匆 ， 但 有 时 却 需 要 我 们 放 慢 脚步 享受 生活 ， 并 
发 的 程序 也 是 一 样 : 有 时 候 我 们 需要 适当 地 控制 并 发 的 程度 ， 因 为 这 样 不 仅仅 可 给 其 它 的 应 
用 /任务 让 出 / 预 留 一 定 的 CPU 资源 ， 也 可 以 适当 降低 功 耗 缓解 电池 的 压力 。 


在 Go 语言 自 带 的 godoc 程 序 实 现 中 有 一 个 vfs 的 包 对 应 虚拟 的 文件 系统 ， 在 vts 包 下 面 有 一 
个 gatefs 的 子 包 ， gatefs 子 包 的 目的 就 是 为 了 控制 访问 该 虚拟 文件 系统 的 最 大 并 发 
数 。 gatefs 包 的 应 用 很 简单 : 


import ( 
"golang.org/x/tools/godoc/vfs" 
"golang.org/x/tools/godoc/vfs/gatefs" 
) 


func main() { 
fs :- gatefs.New(vfs.OS("/path"), make(chan bool, 8)) 
/0 


其 中 vfs.os("/path") 基于 本 地 文件 系统 构造 一 个 虚拟 的 文件 系统 ， 然 后 gatefs.New 基于 现 
有 的 虚拟 文件 系统 构造 一 个 并 发 受 控 的 虚拟 文件 系统 。 并 发 数控 制 的 原理 在 前 面 一 节 已 经 讲 
这， 就 是 通过 溃 线 存 管道 的 发 送 和 接收 规则 来 实现 最 大 并 发 阻 罕 : 


var limit = make(chan int, 3) 


func main() { 
for _, w := range work ( 
gorune O 
limit <- 1 
w() 
«-limit 
}() 


} 
select{} 


不 过 gatefs 对 此 做 一 个 抽 象 类 型 gate ^? 增加 了 enter 和 leave 方法 分 别 对 应 并 发 代码 的 进 
入 和 离开 。 当 超出 并 发 数目 限制 的 时 候 ， enter 方法 会 阻塞 直到 并 发 数 降下 来 为 止 。 
type gate chan bool 


func (g gate) enter() { g <- true } 
func (g gate) leave() ( <-g } 


gatefs 包装 的 新 的 虚拟 文件 系统 就 是 将 需要 控制 并 发 的 方法 增加 了 enter fe leave 调用 而 
已 : 


type gatefs struct { 
fs vfs.FileSystem 
gate 


func (fs gatefs) Lstat(p string) (os.FileInfo, error) { 
fs.enter() 
defer fs.leave() 
return fs.Lstat(p) 


我 们 不 仅 可 以 控制 最 大 的 并 发 数目 ， 而 且 可 以 通过 带 缓 存 Channel 的 使 用 量 和 最 大 容量 比例 来 
判断 程序 运行 的 并 发 率 。 当 管道 为 空 的 时 候 可 以 认为 是 空闲 状态 ， 当 管道 满 了 时 任务 是 繁忙 
状态 ， 这 对 于 后 台 一 些 低级 任务 的 运行 是 有 参考 价值 的 。 增 加 的 方法 如 下 : 


func (g gate) Len() int { return len(g) } 
func (g gate) Cap() int { return cap(g) } 


func (g gate) Idle() bool ( return len(g) == 0 } 
func (g gate) Busy() bool { return len(g) == cap(g) } 


func (g gate) Fraction() float64 { 
return floate4(ien(g)) / floate4(cap(g)) 


然后 我 们 可 以 在 相对 空闲 的 时 候 处 理 一 些 后 台 低 优先 级 的 任务 ， 在 并 发 相对 繁忙 或 超出 一 定 


比例 的 时 候 提 供 预 警 : 


func New(fs vfs.FileSystem, gate chan bool) *gatefs { 
p := &gatefs(fs, gate} 


// 后 台 监 控 线 程 
go func() 1 
(OT 
switch { 
case p.gate.Idle(): 
// 处 理 后 台 任 务 
case p.gate.Fraction() >= 0.7: 
// 并 发 预警 
default: 
time.Sleep(time.Second) 
j 
} 
}() 
return p 


这 样 我 们 通过 后 台 线 程 就 可 以 根据 程序 的 状态 动态 调整 自己 的 工作 模式 。 
BA AL 
X X 


在 “Hello world 的 革命 ”一 节 中 ， 我 们 为 了 演示 Newsqueak 的 并 发 特性 ， 文 中 给 出 了 并 发 版 本 
素数 得 的 实现 。 并 发 版 本 的 素数 得 是 一 个 经 典 的 并 发 例子 ， 通 过 它 我 们 可 以 更 深刻 地 理解 Go 


语言 的 并 发 特性 。" 素 数 得 ?的 原理 如 图 : 





的 0、1) 


y 
» 


我 们 需要 先生 成 最 初 的 2，3，4，... 自然 数 序列 (不 包 
// 返回 生成 自然 数 序列 的 管道 : 2，3，4，... 
func GenerateNatural() chan int { 

ch :- make(chan int) 
go func() { 
fori -= 2; ; Iti f 
ch <- i 
} 
}() 


return ch 


GenerateNatural 遂 数 内 部 启动 一 个 Goroutine 生 产 序列 ， 返 回 对 应 的 管道 。 
然后 是 为 每 个 素数 构造 一 个 算 子 : 将 输入 序列 中 是 素数 倍数 的 数 提出 ， 并 返回 新 的 序列 ， 是 


一 个 新 的 管道 。 


// 管道 过 滤器 : 删除 能 被 素数 整除 的 数 
func PrimeFilter(in «-chan int, prime int) chan int { 
out := make(chan int) 
go func() 1 
for 1 
if i := «-in; i*rime !- 0 ( 
out «- i 
j 
} 
}() 


return out 


PrimeFilter 函数 也 是 内 部 启动 一 个 Goroutine 生 产 序列 ， 返 回 过 滤 后 序列 对 应 的 管道 。 


现在 我 们 可 以 在 main 函数 中 驱动 这 个 并 发 的 素数 算 了 : 


func main() { 
ch := GenerateNatural() // 自然 数 序列 : 2, 3, 4, ... 
oye ab gE oa es oo tf 
prime := «-ch // 新 出 现 的 素数 
fmt.Printf("%v: %v\n", i+1, prime) 
ch = PrimeFilter(ch, prime) // 基于 新 素数 构造 的 过 滤器 


我 们 先是 调用 GenerateNatural() 生成 最 原始 的 从 2 开始 的 自然 数 序列 。 然 后 开始 一 个 100 次 和 迭 
代 的 循环 ， 和 希望 生成 100 个 素数 。 在 每 次 循环 先 代 开始 的 时 候 ， 管 道中 的 第 一 个 数 必定 是 素 
数 ， 我 们 先 读 取 并 打印 这 个 素数 。 然 后 基于 管道 中 剩余 的 数列 ， 并 以 当前 取出 的 素数 为 筛子 
过 滤 后 面 的 素数 。 不 同 的 素数 第 子 对 应 的 管道 是 串联 在 一 起 的 。 


素数 得 展示 了 一 种 优雅 的 并 发 程序 结构 。 但 是 因为 每 个 并 发 体 处 理 的 任务 粒度 太 细 微 ， 程 序 
整体 的 性 能 并 不 理想 。 对 于 细 力 度 的 并 发 程序 ，CSP 模 型 中 国有 的 消息 传递 的 代价 太 高 了 
(多 线程 并 发 模型 同样 要 面临 线程 启动 的 代价 ) 。 


并 发 的 安全 退出 


有 时 候 我 们 需要 通知 goroutine 停 止 它 正在 干 的 事情 ， 特 别 是 当 它 工作 在 错误 的 方向 上 的 时 
候 。Go 语 言 并 没有 提供 在 一 个 直接 终止 Goroutine 的 方法 ， 由 于 这 样 会 导致 goroutine 之 间 的 共 
享 变量 落 在 未 定义 的 状态 上 “。 但 是 如 果 我 们 想 要 退出 两 个 或 者 任意 多 个 Goroutine 怎 么 办 呢 ? 


0 语言 中 不 同 Goroutine 之 间 主 要 依靠 管道 进行 通信 和 同步 。 要 同时 处 理 多 个 管道 的 发 送 或 接 
Hd ， 我 们 需要 使 用 select 关键 字 E uc T select 函数 的 行为 类 
似 ) 。 当 select 有 多 个 分 支 时 ， 会 随机 选择 一 个 可 用 的 管道 分 支 ， 如 果 没 有 可 用 的 管道 分 支 


则 选择 default 2 Xx , 否则 会 一 直 保 存 阻塞 状态 


基于 select 实现 的 管道 的 超时 判断 : 


select ( 

case v :- «-in: 
fmt.Println(v) 

case «-time.After(time.Second): 
return // 起 由 


通过 select 的 default 分 支 实现 非 阻 塞 的 管道 发 送 或 接收 操作 : 


select ( 
case V :2 «-in: 
fmt.Println(v) 
default: 
// 没有 数据 
} 


通过 select 来 阻止 main 苞 数 退出 : 


func main() { 
// do some thins 
select{} 


当 有 多 个 管道 均 可 操作 时 ， select 会 随机 选择 一 个 管道 。 基 于 该 特性 我 们 可 以 用 select X 
现 一 个 生成 随机 数列 的 程序 : 


func main() { 


ch := make(chan int) 
go func() { 
Oe ag 
select { 


case ch <- 0: 
case ch «- 1: 
j 
} 
}() 


for v := range ch { 
fmt.Println(v) 


我 们 通过 select 和 default 分 支 可 以 很 容易 实现 一 个 Goroutine 的 退出 控制 : 


func worker(cannel chan bool) { 
for 1 

select { 

default: 
fmt.Println("hello") 
// iE3& 4t 

case «-cannel: 
// i&ih 


func main() { 
cannel :- make(chan bool) 
go worker(cannel) 


time.Sleep(time.Second) 
cannel «- true 


但 是 管道 的 发 送 操作 和 接收 操作 是 一 一 对 应 的 ， 如 果 要 停止 多 个 Goroutine 那 么 可 能 需要 创建 
ee MM GEM 其 实 我 们 可 以 通过 close 关闭 一 个 管道 来 实现 广播 的 效 
果 ， 所 有 从 关闭 管道 接收 的 操作 均 会 收 到 一 个 零 值 和 一 个 可 选 的 失败 标志 。 


func worker(cannel chan bool) { 
for 1 

select ( 

default: 
fmt.Println("hello") 
// iE 作 

case «-cannel: 
// 退出 


func main() { 
cancel :- make(chan bool) 


Om ESO Pa s oS a 


go worker(cancel) 


time.Sleep(time.Second) 
close(cancel) 


我 们 通过 close 来 关闭 cancel 管道 向 多 个 Goroutine 广 播 退出 的 指令 。 不 过 这 个 程序 依然 不 
够 稳健 : 当 每 个 Goroutine 收 到 退出 指令 退出 时 一 般 会 进行 一 定 的 清理 工作 ， 但 是 退出 的 清理 
工作 并 不 能 保证 被 完成 ， 因 为 main 线程 并 没有 等 待 各 个 工作 Goroutine 退 出 工作 完成 的 机 
制 。 我 们 可 以 结合 sync.WaitGroup 来 改进 


func worker(wg *sync.WaitGroup, cannel chan bool) { 
defer wg.Done() 


Toni 
select { 
default: 
fmt.Println("hello") 
case «-cannel: 
return 


} 


func main() { 
cancel := make(chan bool) 


var wg sync.WaitGroup 

tonc sar a e allo EET 
wg.Add(1) 
go worker (&wg, cancel) 


} 


time.Sleep(time.Second) 
close(cancel) 
wg.Wait() 


现在 每 个 工作 者 并 发 体 的 创建 、 运 行 、 暂 停 和 退出 都 是 在 main 函数 的 安全 控制 之 下 了 。 


消费 海量 的 请 求 


在 前 面 的 生产 者 、 消 费 者 并 发 模型 中 ， 只 有 当 生 产 者 和 消费 的 速度 近似 相等 时 才 会 达到 最 佳 
的 效果 ， 同 时 通过 引入 带 缓存 的 管道 可 以 消除 因 临 时 效率 波动 产生 的 影响 。 但 是 当 生 产 者 和 
消费 者 的 速度 严重 不 匹配 时 ， 我 们 是 无 法 通过 带 缓 存 的 管道 来 提高 性 能 的 〈 缓 存 的 管道 只 能 
延缓 问题 发 生 的 时 间 ， 无 法 消除 速度 差异 带 来 的 问题 ) 。 当 消费 者 无 法 及 时 消费 生产 者 的 输 
出 时 ， 时 间 积累 会 导致 问题 越 来 越 严重 。 


对 于 生产 者 、 消 费 者 并 发 模型 ， 我 们 当然 可 以 通过 降低 生产 者 的 产能 来 避免 资源 的 浪费 。 但 
在 很 多 场景 中 ， 生 产 者 才 是 核心 对 象 ， 它 们 生产 出 各 种 问题 或 任务 单据 ， 这 时 候 产 出 的 问题 
是 必须 要 解决 的 、 任 务 单据 也 是 必须 要 完成 的 。 在 现实 生活 中 ， 制 造 各 种 生活 垃圾 的 海量 人 
类 其 实 就 是 垃圾 生产 者 ， 而 清理 生活 垃圾 的 少量 的 清洁 工 就 是 垃圾 消费 者 。 在 网 络 服务 中 ， 


提交 POST 数据 的 海量 用 户 则 变 成 了 生产 者 ，Web 后 台 服 务 则 对 应 POST 数据 的 消费 者 。 海 量 
生产 者 的 问题 也 就 变 成 了 : 如 何 构造 一 个 能 够 处 理 海 量 请 求 的 Web 服 务 (假设 每 分 钟 百 万 级 
请 求 ) 。 


在 Web 服 务 中 ， 用 户 提 交 的 每 个 POST 请 求 可 以 看 作 是 一 个 Job 任 务 ， 而 服务 器 是 通过 后 台 的 
人 我 们 一 般 可 以 通过 构造 一 个 
Worker 工 作者 池 来 提高 Job 的 处 理 效 率 ; 通过 一 个 带 缓存 的 Job 管 TAERAA R’ 
免 任务 请 求 功能 无 法 响应 ; Job 请 求 接收 管道 和 Worker 工 作者 池 通 过 分 发 系统 来 衔接 。 


我 们 可 以 用 管道 来 模拟 工作 者 池 : 当 需 要 处 理 一 个 任务 时 ， 先 从 工作 者 池 取 一 个 工作 者 ， 处 
理 完 任务 之 后 将 工作 者 返回 给 工作 者 池 。 workerPool 对 应 工作 者 池 ， worker 对 应 工作 者 。 


type WorkerPool struct { 
workers []*Worker 
pool chan *Worker 


// 构造 工作 者 池 
func NewWorkerPool(maxWorkers int) *WorkerPool { 
p := &WorkerPool( 
workers: make([]*Worker, maxWorkers) 


pool: make(chan *Worker, maxWorkers) 
} 
// 初始 化 工作 者 
for i, | := range p.workers { 
worker := NewWorker(6) 
p.workers[i] - worker 
p.pool «- worker 
j 
return p 
} 
// 启动 工作 者 
func (p *WorkerPool) Start() { 
for _, worker := range p.workers { 
worker.Start() 
} 
} 
// 停止 工作 者 
func (p *WorkerPool) Stop() { 
for _, worker := range p.workers { 
worker.Stop() 
} 
} 
// 获取 工作 者 (阻塞 ) 


func (p *WorkerPool) Get() *Worker 1 
return <-p.pool 


// 返回 工作 者 
func (p *WorkerPool) Put(w *Worker) { 
p.pool «- w 


工作 者 池 通 过 一 个 带 缓存 的 管道 来 提高 工作 者 的 管理 。 当 所 有 工作 者 都 在 处 理 任务 时 ， 工 作 
者 的 获取 会 阻塞 自动 有 工作 者 可 用 为 止 。 


Worker 对 应 工作 者 实现 ， 上 有 具体 任务 由 后 人 台 一 个 固定 的 Goroutine 完 成 ， 和 外 界 通过 专 有 的 管 
道 通信 (工作 者 的 私有 管道 也 可 以 选择 带 有 一 定 的 缓存 ) 具体 实现 如 下 : 


type Worker struct { 
job chan interface() 
quit chan bool 
wg sync.WaitGroup 


// 构造 工作 者 
func NewWorker(maxJobs int) *Worker { 
return &Worker( 
job: make(chan interface[), maxJobs), 
quit: make(chan bool), 


// 启动 住 务 
func (w *Worker) Start() { 
p.wg.Add(1) 


go func() (1 
defer p.wg.Done() 


for { 
// 接收 任务 
// 此 时 工作 中 已 经 从 工作 者 池 中 取出 
select [f 


case job :- «-p.job: 
// 处 理 任 务 


case <-w.quit: 
return 


}() 


// 关闭 任务 

func (p *Worker) Stop() 1 
p.quit «- true 
p.wg.Wait() 


// 提交 任务 
func (p *Worker) AddJob(job interface{}) 1 
p.job «- job 


任务 的 分 发 系统 在 service 对 象 中 完成 : 


type Service struct ( 
workers *WorkerPool 
jobs chan interfaces 
maxJobs int 
wg sync.WaitGroup 


func NewService(maxWorkers, maxJobs int) *Service { 
return &Service { 
workers: NewWorkerPool(maxWorkers), 
jobs: make(chan interface[), maxJobs), 


func (p *Service) Start() { 
p.jobs = make(chan interface[), maxJobs) 


p.wg.Add(1) 
p.workers.Start() 


go func() (1 
defer p.wg.Done() 


for job :- range p.jobs: 
go func(job Job) { 
VI JEAE Ap 0C — 4 ER 


worker :- p.workers.Get() 


eut AEIImnL L o 
// 完成 任务 后 返回 给 工作 者 池 


// 提交 任务 处 理 (异步 ) 
worker.AddJob(job) 
3 (job) 


}() 


} 
func (p *Service) Stop() { 


p.workers.Stop() 
close(p.jobs) 
p.wg.Wait() 






了 道 带 较 大 的 绥 存 ， 延 组 阻塞 的 时 间 
func (p *Service) AddJob(job interface{}) { 
p.jobs <- job 


主 程序 可 以 是 一 个 Web 服务 器 : 


var ( 
Maxworker = os.Getenv("MAX WORKERS") 
MaxQueue = os.Getenv("MAX QUEUE") 


func main() { 


service :- NewService(MaxWorker, MaxQueue) 


service.Start() 
defer service.Stop() 


// 处 理 海量 的 任务 


http.HandleFunc("/jobs", func(w http.ResponseWriter, r *http.Request) ( 


if r.Method !- "POST" ( 
w.WriteHeader(http.StatusMethodNotAllowed) 
return 

} 


// Job 以 JSON 格 式 提交 
var jobs []Job 
err :- json.NewDecoder(io.LimitReader(r.Body, MaxLength)).Decode(&jobs) 
if err !- nil ( 
w.Header().Set("Content-Type", "application/json; charset-UTF-8") 
w.WriteHeader(http.StatusBadRequest) 
return 


// 处 理 任务 
for _, job := range jobs { 
service.AddJob(job) 


} 
// OK 
w.WriteHeader(http.StatusOK) 
1) 
// 启动 Web 服 务 


log.Fatal(http.ListenAndServe(":8080", nil)) 


基于 Go 语言 特有 的 管道 和 Goroutine 特 性 ， 我 们 以 非常 简单 的 方式 设计 了 一 个 针对 海量 请 求 的 
处 理 系统 结构 。 在 实际 的 系统 中 ， 用 户 可 以 根据 任务 的 具体 类 型 和 特性 ， 将 管道 定义 为 具体 
类 型 以 避免 接口 等 动态 特性 导致 的 开销 。 


更 多 


在 Go1.7 发 布 时 ， 标 准 库 增加 了 一 个 context. 包 ， 用 来 简化 对 于 处 理 单 个 请 求 的 多 个 
Goroutine 之 间 与 请 求 域 的 数据 、 超 时 和 退出 等 操作 ， 官 方 有 博文 对 此 做 了 专门 介绍 。 我 们 可 
以 用 context 包 来 重新 实现 前 面 的 线程 安全 退出 或 超时 的 控制 : 


func worker(ctx context.Context, wg *sync.WaitGroup) error { 
defer wg.Done() 


uat 
select f 
default: 
fmt.Println("hello") 
case «-ctx.Done(): 
return ctx.Err() 


} 


} 


func main() { 
ctx, cancel :- context.WithTimeout(context.Background(), 10*time.Second) 


var wg sync.WaitGroup 
pom ab ES Oe at xs alo alaran Jt 
wg .Add(1) 
go worker(ctx, &wg) 


} 


time.Sleep(time.Second) 
cancel() 


wg.Wait() 


当 并 发 体 超时 或 main 主动 停止 工作 者 Goroutine 时 ， 每 个 工作 者 都 可 以 安全 退出 。 


Go 语言 是 带 内 存 自动 回收 的 特性 ， 因 此 内 存 一 般 不 会 泄漏 。 在 前 面 素数 得 的 例子 

T > GenerateNatural 和 primeFilter 函数 内 部 都 启动 了 新 的 Goroutine， 当 main 函数 不 再 使 
用 管道 时 后 台 Goroutine 有 泄漏 的 风险 。 我 们 可 以 通过 context 包 来 避免 这 个 问题 ， 下 面 是 改 
进 的 素数 得 实现 : 


// 返回 生成 自然 数 序列 的 管道 : 2，3，4， 
func GenerateNatural(ctx context.Context) chan int { 
ch := make(chan int) 
go func() (1 
for i = 2; itt f 
select { 
case <- ctx.Done(): 
return 
case ch «- i: 





j 
} 
}() 
return ch 
} 
// fibi 删除 能 被 素数 整除 的 数 
func PrimeFilter(ctx context.Context, in «-chan int, prime int) chan int { 
out :- make(chan int) 
go func() { 
for { 
if i := «-in; i%prime != 0 { 
select { 


case <- ctx.Done(): 
return 
case out <- i: 


j 


}() 


return out 


func main() { 
// 通过 Context 控制 后 台 Goroutine 状 态 


ctx, cancel := context.WithCancel(context.Background()) 


ch := GenerateNatural(ctx) // 自然 数 序列 : 2, 3, 4, 
fomai RP ETE Og acre 
prime := «-ch // 新 出 现 的 素数 
fmt.Printf("%v: %v\n", i+1, prime) 
ch = PrimeFilter(ctx, ch, prime) // 基于 新 素数 构造 的 过 





cancel() 


3i main i Zt 7C LIE E RI» 38 7878 cancel() 来 通知 后 台 Goroutine 退 出 ， 这 样 就 避免 了 
Goroutine 的 泄漏 。 


并 发 是 一 个 非常 大 的 主题 ， 我 们 这 里 只 是 展示 几 个 非常 基础 的 并 发 编程 的 例子 。 官 方 文档 也 
有 很 多 关于 并 发 编程 的 讨论 ， 国 内 也 有 专门 讨论 Go 语言 并 发 编程 的 书籍 。 读 者 可 以 根据 自己 
的 需求 查阅 相关 的 文献 。 


1.7. 错误 和 异常 


错误 处 理 是 每 个 编程 语言 都 要 考虑 的 一 个 重要 话题 。 在 Go 语言 的 错误 处 理 中 ， 错 误 是 软件 包 
APl 和 应 用 程序 用 户 界 面 的 一 个 重要 组 成 部 分 。 


在 程序 中 总 有 一 部 分 函数 总 是 要 求 必须 能 够 成 功 的 运行 9 比如 strconv.Itoa 将 整数 转换 为 字 
符 串 ， 从 数组 或 切片 中 读 写 元 素 ， 从 map 读 取 已 经 存在 的 元 素 等 。 这 类 操作 在 运行 时 几乎 不 
会 失败 ， 除 非 程序 中 有 BUG， 或 遇 到 灾难 性 的 、 不 可 预料 的 情况 ， 比 如 运行 时 的 内 存 溢出 。 
如 果 蜂 的 遇 到 监 正 异 常情 况 ， 我 们 只 要 简单 终止 程序 就 可 以 了 。 


排除 异常 的 情况 ， 如 果 程 序 运行 失败 仅 被 认为 是 几 个 预期 的 结果 之 一 。 对 于 那些 将 运行 失败 
看 作 是 预期 结果 的 函数 ， 它 们 会 返回 一 个 额外 的 返回 值 ， 通常 是 最 后 一 个 来 传递 错误 信息 。 
如 果 导 致 失败 的 原因 只 有 一 个 ， 额 外 的 返回 值 可 以 是 一 个 布尔 值 ， 通常 被 命名 为 Ook。 比如， 
当 从 一 个 map 查询 一 个 结果 时 ， 可 以 通过 额外 的 布尔 值 判断 是 否 成 功 : 


if v, ok := m["key"]; ok { 
return v 


} 


但 是 导致 失败 的 原因 通常 不 止 一 种 ， 很 多 时 候 用 户 希 望 了 解 更 多 的 错误 信息 。 如 果 只 是 用 简 
单 的 布尔 类 型 的 状态 值 将 不 能 满足 这 个 要 求 。 在 C 语 言 中 ， 默 认 采 用 一 个 整数 类 型 的 errno 来 
表达 错误 ， 这样 就 可 以 根据 需要 定义 多 种 错误 类 型 2 在 Go 语言 中 ? syscall.Errno 就 是 对 应 C 
语言 中 errno 类 型 的 错误 。 在 syscall 包 中 的 接口 ， 如 果 有 返回 错误 的 话 ， 底 层 也 


是 syscall.Errno 错误 类 型 。 


比如 我 们 通过 syscall 包 的 接口 来 修改 文件 的 模式 时 ， 如 果 遇 到 错误 我 们 可 以 将 err 强制 断 


言 为 syscall.Errno 错误 类 型 处 理 : 


err := syscall.Chmod(":invalid path:", 0666) 

if err !- nil ( 
log.Fatal(err.(syscall.Errno)) 

} 


我 们 还 可 以 进一步 地 通过 类 型 查询 或 类 型 断言 来 获取 底层 真实 的 错误 类 型 ， 这 样 就 可 以 获取 
更 详细 的 错误 信息 。 不 过 一 般 情 况 下 我 们 并 不 关心 错误 在 底层 的 表达 方式 ， 我 们 只 需要 知道 
它 是 一 个 错误 就 可 以 了 。 当 返回 的 错误 值 不 是 nil 时 ， 我 们 可 以 通过 调用 error 接口 类 型 
的 Error 方法 来 获得 字符 串 类 型 的 错误 信息 9 

在 Go 语言 中 ， 错 误 被 认为 是 一 种 可 以 预期 的 结果 ; 而 异常 则 是 一 种 非 预期 的 结果 ， 发 生 有 异常 


可 能 表示 程序 中 存在 BUG 或 发 生 了 其 它 不 可 控 的 问题 8 Go 语言 推荐 使 用 recover 函数 将 内 部 
异常 转 为 错误 处 理 ， 这 使 得 用 户 可 以 站 正 的 关心 业务 相关 的 错误 处 理 。 


Rosado Dr Ue A 误 当 做 异常 抛 出 ， 将 会 使 错误 信息 杂乱 且 没 有 价值 。 就 
像 在 main 函数 中 直接 捕获 全 部 一 样 ， 是 没有 意义 的 : 


func main() { 
defer func() 4 
if r := recover(); r != nil { 
log.Fatal(r) 


}() 


捕获 异常 不 是 最 终 的 目的 。 如 果 异 常 不 可 预测 ， 直 接 输 出 异常 信息 是 最 好 的 处 理 方式 。 


4i iX Ab IE Ww 


让 我 们 演示 一 个 文件 复制 的 例子 : 函数 需要 打开 两 个 文件 ， 然 后 将 其 中 一 个 文件 的 内 容 复 制 
到 另 一 个 文件 : 


func CopyFile(dstName, srcName string) (written int64, err error) { 


Src, err :- os.Open(srcName) 
if err !— nil ( 

return 
} 
dst, err := os.Create(dstName) 
if err !- nil ( 

return 
} 


written, err = io.Copy(dst, src) 
dst.Close() 

src.Close() 

return 


上 面 的 代码 虽然 能 够 工作 ， 但 是 隐藏 一 个 bug。 如 果 第 一 个 os.open 调用 失败 ， 那 么 会 在 没有 
释放 src 文件 资源 的 情况 下 返回 。 虽 然 我 们 可 以 通过 在 第 二 个 返回 语句 前 添 

加 src.close() 调用 来 修复 这 个 BUG ; 但 是 当代 码 变 得 复杂 时 ， 类 似 的 问题 将 很 难 被 发 现 和 
修复 。 我 们 可 以 通过 defer 语句 来 确保 每 个 被 正常 打开 的 文件 都 能 被 正常 关闭 : 


func CopyFile(dstName, srcName string) (written int64, err error) { 


Src, err :- os.Open(srcName) 
if err !- nil { 
return 
} 
defer src.Close() 
dst, err :- os.Create(dstName) 
if err !- nil ( 
return 
} 


defer dst.Close() 


return io.Copy(dst, src) 


defer 语句 可 以 让 我 们 在 打开 文件 时 马上 思考 如 何 关闭 文件 。 不 管 函数 如 何 返回 ， 文 件 关闭 
语句 始终 会 被 执行 。 同 时 defer 语句 可 以 保证 ， 即 使 io.copy 发 生 了 异常 ， 文 件 依然 可 以 安 
全 地 关闭 。 


前 文 我 们 说 到 ，Go 语 言 中 的 导出 函数 一 般 不 抛 出 异常 ， 一 个 未 受 控 的 异常 可 以 看 作 是 程序 的 
BUG。 但 是 对 于 那些 提供 类 似 Web 服 务 的 框架 而 言 ; 它们 经 常 需要 接 入 第 三 方 的 中 间 件 。 因 
为 第 三 A eld 会 抛 出 异常 ，Web 框 架 本 身 是 不 能 确定 的 。 为 了 提高 系 
统 的 稳定 性 ，Web 框 架 一 般 会 通过 recover. 来 防御 性 地 捕获 所 有 处 理 流程 中 可 能 产生 的 弄 
常 ， 然 后 将 异常 转 为 普通 eda o 


让 我 们 以 JSON 解 析 器 为 例 ， 说 明 recover 的 使 用 场景 。 考 虑 到 JSON 解 析 器 的 复杂 性 ， 即 使 某 
个 语言 解析 器 目前 工作 正常 ， 也 无 法 肯定 它 没 有 漏洞 。 因 此 ， 当 某 个 异常 出 现时 ， 我 们 不 会 

选择 让 解析 器 崩 演 ， 而 是 会 将 panic 弄 常 当 作 普通 的 解析 错误 ， 并 附加 额外 信息 提醒 用 户 报 告 
此 错误 。 


func ParseJSON(input string) (s *Syntax, err error) { 
defer func() ( 
if p := recover(); p != nil { 
err = fmt.Errorf("JSON: internal error: 9", p) 


在 标准 库 中 的 json 包 ， 在 内 部 递归 解析 JSON 数 据 的 时 候 如 果 遇 到 错误 ， 会 通过 抛 出 异常 的 
方式 来 快速 跳出 深度 具 套 的 函数 调用 ， 然 后 由 最 外 一 级 的 接口 通过 recover 捕获 panic ， 然 
后 返回 相应 的 错误 信息 。 


Go 语言 库 的 实现 习惯 : 即使 在 包 内 部 使 用 了 panic ， 但 是 在 寻 出 函数 时 会 被 转化 为 明确 的 错 
误 值 。 


获取 错误 的 上 下 文 


有 了 时候 为 了 方便 上 层 用 户 理解 ; 很 多 时 候 底 层 实现 者 会 将 底层 的 错误 重新 包装 为 新 的 错误 类 
型 返回 给 用 户 : 


if _, err := html.Parse(resp.Body); err !- nii ( 
return nil, fmt.Errorf("parsing %s as HTML: %v“, url,err) 
} 
上 层 用 户 在 遇 到 错误 时 ， 可 以 很 容易 从 业务 层面 理解 错误 发 生 的 原因 。 但 是 鱼 和 熊 掌 总 是 很 
难 兼 得 ， 在 上 层 用 户 获得 新 的 错误 的 同时 ， 我 们 也 丢失 了 底层 最 原始 的 错误 类 型 (RATH 


误 描述 信息 了 ) 。 


为 了 记录 这 种 错误 类 型 在 包装 的 变迁 过 程 中 的 信息 ， 我 们 一 般 会 定义 一 个 辅助 
的 wrapError 函数 ， 用 于 包装 原始 的 错误 ， 同 时 保留 完整 的 原始 错误 类 型 。 为 了 问题 定位 的 
方便 ， 同 时 也 为 了 能 记录 错误 发 生 时 的 函数 调用 状态 ， 我 们 很 多 时 候 希 望 在 出 现 致命 错误 的 
时 候 保存 完整 的 函数 调用 信息 。 同 时 ， 为 了 支持 RPC 等 跨 网 络 的 传输 ， 我 们 可 能 要 需要 将 错 
误 序 列 化 为 类 似 JSON 格 式 的 数据 ， 然 后 再 从 这 些 数 据 中 将 错误 解码 恢复 出 来 。 


为 此 ， 我 们 可 以 定义 自己 的 github.com/chai2010/errors 包 ， 里 面 是 以 下 的 错误 类 型 : 


type Error interface ( 
Caller() []Callerinfo 
Wraped() []error 
Code() int 
error 


private() 


} 


type CallerInfo struct { 
FuncName string 
FileName string 
FileLine int 


其 中 Error 为 接口 类 型 ， 是 error 接口 类 型 的 扩展 ， 用 于 给 错误 增加 调用 栈 信息 ， 同 时 支持 
错误 的 多 级 诅 套 包装 ， 支 持 错 误 码 格式 。 为 了 使 用 方便 ， 我 们 可 以 定义 以 下 的 辅助 函数 : 


func New(msg string) error 
func NewWithCode(code int, msg string) error 


func Wrap(err error, msg string) error 
func WrapWithCode(code int, err error, msg string) error 


func FromJson(json string) (Error, error) 
func ToJson(err error) string 


New 用 于 构建 新 的 错误 类 型 ， 和 标准 库 中 errors.New 功能 类 似 ， 但 是 增加 了 出 错误 时 的 函数 
调用 栈 信息 。 FromJson 用 于 从 JSON 字 符 串 编码 的 错误 中 恢复 错误 对 象 。 Newwithcode 则 是 
构造 一 个 带 错误 码 的 错误 ， 同 时 也 包含 出 错误 时 的 函数 调用 栈 信 
息 。 wrap 和 wrapwithcode 则 是 错误 二 次 包装 函数 ， 用 于 将 底层 的 错误 包装 为 新 的 错误 ， 但 
是 保留 的 原始 的 底层 错误 信息 。 这 里 返回 的 错误 对 象 都 可 以 直接 调用 json.Marshal 将 错误 编 
码 为 JSON 字 符 串 。 


我 们 可 以 这 样 使 用 包装 函数 : 


import ( 
"github.com/chai2010/errors" 


func loadConfig() error { 
_ err := ioutil.ReadFile("/path/to/file") 


if err !- nil { 

return errors.Wrap(err, "read failed") 
} 
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func setup() error { 
err :- loadConfig() 
if err !- nil ( 
return errors.Wrap(err, "invalid config") 


7 wat 


func main() { 
if err := setup(); err != nil ( 
log.Fatal(err) 


1. "an 


上 面 的 例子 中 ， 错 误 被 进行 了 2 层 包 装 。 我 们 可 以 这 样 遍历 原始 错误 经 历 了 哪些 包装 流程 
for i, e := range err.(errors.Error).Wraped() { 
fmt.Printf("wraped(9?d): %v\n", i, e) 
同时 也 可 以 获取 每 个 包装 错误 的 函数 调用 堆栈 信息 : 


for i, x := range err.(errors.Error).Caller() { 
fmt.Printf("caller:9d: %s\n", i, x.FuncName) 


如 果 需 要 将 错误 通过 网 络 传输 ， 可 以 用 errors.ToJson(err) 编码 为 JSON 字 符 串 : 


// 以 JSON 字 符 串 方式 发 送 错 误 
func sendError(ch chan<- string, err error) { 
ch «- errors.ToJson(err) 


H 

// 接收 JSON 字 符 串 格式 的 错误 

func recvError(ch «-chan string) error ( 
p, err :- errors.FromJson(«-ch) 
if err !- nil ( 


log.Fatal(err) 
} 


return p 


对 于 基于 http 协 议 的 网 络 服务 ， 我 们 还 可 以 给 错误 绑 定 一 个 对 应 的 http 状 态 码 : 


err := errors.NewWithCode(404, "http error code") 


fmt.Println(err) 
fmt.Println(err.(errors.Error).Code()) 


在 Go 语言 中 ， 错 误 处 理 也 有 一 套 独 特 的 编码 风格 。 检 查 某 个 子 函 数 是 否 失败 后 ， 我 们 通常 将 
处 理 失败 的 逻辑 代码 放 在 处 理 成 功 的 代码 之 前 。 如 果 某 个 错误 会 导致 函数 返回 ， 那 么 成 功 时 
的 逻辑 代码 不 应 放 在 else 语句 块 中 ， 而 应 直接 放 在 函数 体 中 。 


f, err := os.Open("filename.ext") 
if err != nil { 
// 失败 的 情形 ， 上 返回 错 





Go 语言 中 大 部 分 函数 的 代码 结构 几乎 相同 ， 首 先是 一 系列 的 初始 检查 ， 用 于 防止 错误 发 生 ， 
之 后 是 函数 的 实际 逻辑 。 


wx "JG o 
错误 的 错误 返回 
Go 语言 中 的 错误 是 一 种 接口 类 型 。 接 口 信息 中 包含 了 原始 类 型 和 原始 的 值 。 只 有 当 接口 的 类 
型 和 原始 的 值 都 为 空 的 时 候 ， 接 口 的 值 才 对 应 nii 。 其 实 当 接口 中 类 型 为 空 的 时 候 ， 原 始 值 
必然 也 是 空 的 ; 反之 ， 当 接口 对 应 的 原始 值 为 空 的 时 候 ， 接 口 对 应 的 原始 类 型 并 不 一 定 为 空 
的 。 


在 下 面 的 例子 中 ， 试 图 返回 自 定义 的 错误 类 型 ， 当 没有 错误 的 时 候 返回 nil : 


func returnsError() error { 
var p *MyError - nil 
if bad() 1 
p = ErrBad 
} 


return p // Will always return a non-nil error. 


但 是 ， 最 终 返 回 的 结果 其 实 并 非 是 nil : 是 一 个 正常 的 错误 ， 错 误 的 值 是 一 个 MyError 类 型 
的 空 指针 。 下 面 是 改进 的 returnsError 


func returnsError() error { 
if bad() 1 
return (*MyError)(err) 


} 


return nil 


因此 ， 在 处 理 错 误 返回 值 的 时 候 ， 没 有 错误 的 返回 值 最 好 直接 写 为 nil 。 


Go 语言 作为 一 个 强 类 型 语言 ， 不 同类 型 之 前 必须 要 显示 的 转换 (而 且 必 须 有 相同 的 基础 类 
A) 。 但 是 ，Go 语 言 中 interface 是 一 个 例外 : 非 接口 类 型 到 接口 类 型 ， 或 者 是 接口 类 型 之 
间 的 转换 都 是 隐 式 的 。 这 是 为 了 支持 方便 的 鸭子 面向 对 葵 编 程 ， 当 然 会 牺牲 一 定 的 安全 特 
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剖析 异常 


panic 支持 抛 出 任意 类 型 的 异常 (而 不 仅仅 是 error. 类 型 的 错误 ) > recover 元 数 调用 的 返 
回 值 和 panic 函数 的 输入 参数 类 型 一 致 ， 它 们 的 函数 签名 如 下 : 


func panic(interface[)) 
func recover() interface() 


Go 语言 函数 调用 的 正常 流程 是 函数 执行 返回 语句 返回 结果 ， 在 这 个 流程 中 是 没有 异常 的 ， 
此 在 这 个 流程 中 执行 recover. 异常 捕获 函数 始终 是 返回 nil 。 另 一 种 是 异常 流程 : b 8A 

用 panic 抛 出 异常 ， 函 数 将 停止 执行 后 续 的 普通 语句 ， 但 是 之 前 注册 的 defer 函数 调用 仍然 
保证 会 被 正常 执行 ， 然 后 再 返回 到 的 调用 者 。 对 于 当前 函数 的 调用 者 ， 因 为 处 理 异常 状态 还 
没有 被 捕获 ， 和 直接 调用 panic 函数 的 行为 类 似 。 在 异常 发 生 时 ， 如 果 在 defer 中 执 

行 recover 调用 ， 它 可 以 捕获 触发 panic 时 的 参数 ， 并 且 恢 复 到 正常 的 执行 流程 。 


在 非 defer 语句 中 执行 recover 调用 是 初学 者 常 犯 的 错误 : 


func main() { 


if r := recover(); r != nil { 
log.Fatal(r) 

} 

panic(123) 

if r := recover(); r != nil f 
log.Fatal(r) 

} 


上 面 程 序 中 两 个 recover 调用 都 不 能 捕获 任何 异常 。 在 第 一 个 recover 调用 执行 时 ， 函 数 必 
然 是 在 正常 的 非 异 常 执行 流程 中 ， 这 时 候 recover 调用 将 返回 nil 。 发 生 异 常 时 ， 第 二 

个 recover 调用 将 没有 机 会 被 执行 到 ， 因 为 panic 调用 会 导致 函数 马上 执行 已 经 注 

At defer 的 函数 后 返回 。 


其 实 recover 函数 调用 有 着 更 严格 的 要 求 : 我 们 必须 在 defer 函数 中 直接 调用 recover 。 如 
果 defer 中 调用 的 是 recover 咏 数 的 包装 函数 的 话 ， 蜡 常 的 捕获 工作 将 失败 | 比如 ， 有 时 候 
我 们 可 能 希望 包装 自己 的 MyRecover 函数 ， 在 内 部 增加 必要 的 日 志 信 息 然后 再 调 

用 recover ， 这 是 错误 的 做 法 : 


func main() { 
defer func() { 


// 无 法 捕获 异常 
if r := MyRecover(); r != nil { 
fmt.Println(r) 
} 
}() 
panic(1) 


} 


func MyRecover() interface() { 
log.Println("trace...") 
return recover() 


AE o decRC4ESR RU) defer 函数 中 调用 recover 也 将 导致 无 法 捕获 异常 : 


func main() { 
defer func() {£ 
defer func() { 


// 无 法 捕获 异常 
if ne = recover NM mane 
fmt.Println(r) 
j 
}() 
}() 
panic(1) 


2 dx EM defer E v 直接 调用 recover 和 1 层 defer 函数 中 调用 包装 的 MyRecover 函数 一 
样 ， 都 是 经 过 了 2 个 函数 帧 才 到 达 申 正 的 recover 函数 ， 这 个 时 候 Goroutine 的 对 应 上 一 级 栈 
W PEZA ARI A o 


如 果 我 们 直接 在 defer 语句 中 调用 MyRecover 函数 又 可 以 正常 工作 了 : 


func MyRecover() interface() { 
return recover() 


} 


func main() { 
// TAERA R 
defer MyRecover() 
panic(1i) 


但 是 如 果 defer 语句 直接 调用 recover 有 函数， 依然 不 能 正常 捕获 异常 : 


func main() { 
// 无 法 捕获 异常 
defer recover() 
panic(1) 


必须 要 和 有 异常 的 栈 帧 只 隔 一 个 栈 帧 ， recover. HAT ERMER o RÈ 
之 ， recover 欧 数 捕获 的 是 祖父 一 级 调用 Ef Zn 的 异常 (刚好 可 以 跨越 一 层 defer 9 
数 ) ! 


当然 ， 为 了 避免 recover 调用 者 不 能 识别 捕获 到 的 异常 ,应 该 避免 用 nil 为 参数 抛 出 异常 : 


func main() { 
defer func() 1 
if m = recover) CSNL ee 


// 虽然 总 是 返回 ni1， 但 是 可 以 恢复 异常 状态 


no) 


// €: 用 `nil 为 参数 抛 出 异常 


panic(nil) 


当 希 望 将 捕获 到 的 异常 转 为 错误 时 ， 如 果 希 望 忠实 返回 原始 的 信息 ， 需 要 针对 不 同 的 类 型 分 
别处 理 : 


func foo() (err error) { 
defer func() ( 
if r :- recover(); r !- nil ( 

switch x := r.(type) { 

case string: 
err - errors.New(x) 

case error: 
err = x 

default: 
err = fmt.Errorf("Unknown panic: %v", r) 


} 
}() 


panic("TODO") 


基于 这 个 代码 模板 ， 我 们 甚至 可 以 模拟 出 不 同类 型 的 异常 。 通 过 为 定义 不 同类 型 的 保护 接 
口 ， 我 们 就 可 以 区 分 异常 的 类 型 了 : 
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func main { 
defer func() { 
if e = recover) ral nl { 
switch x := r.(type) { 
case runtime.Error: 
// 这 是 运行 时 错误 类 型 异常 
case error: 
// 普通 错误 类 型 异常 
default: 
// 其 他 类 型 异常 


}() 


不 过 这 样 做 和 Go 语言 简单 直接 的 编程 哲学 背道而驰 了 。 


1.7. 错误 和 异常 
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1.8. 配置 开发 环境 


工 欲 善 其 事 ， 必 先 利 其 器 ! Go 语言 编程 对 外 部 的 编辑 工具 要 求 甚 低 ， 但 是 配置 适合 自己 的 开 
发 环境 却 可 以 达到 事半功倍 的 效果 。 本 节 简 单 介绍 几 个 作者 常用 的 Go 语言 编辑 器 和 轻 量 级 集 
成 开发 环境 。 


经 过 多 年 的 发 展 完善 ， 目 前 支持 Go 语言 的 开发 工具 已 经 很 多 了 。 其 中 LiteIDE 是 国人 visualfc 
用 Qt 专门 为 Go 语言 开发 的 跨 平台 轻 量 级 集成 开发 环境 。 在 早期 的 Go 语言 的 核心 代码 库 中 也 包 
含 了 vim/Emacs/Netepad++/Eclipse 等 工具 对 Go 语言 支持 的 各 种 插件 ， 目 前 这 些 第 三 方 扩展 
已 经 从 核心 库 剥 离 到 外 部 仓库 去 独立 维护 。 相 对 完整 的 IDE 或 播 件 列表 可 以 从 Go 语言 的 官方 
Wiki 页 面 查看 : https://github.com/golang/go/wiki/IDEsAndTextEditorPlugins ° 


对 于 Windows 环 境 ，Go 语 言 纯 代 码 编 写 的 话 推荐 Notepad++ 工 具 ， 如 果 需 要 代码 自动 补 全 和 
调试 的 话 推荐 使 用 微软 的 Visual Studio Code 集 成 开发 环境 。 如 果 是 Mac OS X 用 户 ， 可 以 选 
择 免费 的 TextMate 编 辑 器 ， 它 被 誉 为 macOS 下 的 Notepad++。 如 果 是 想 基于 iPad Pro 平 台 做 
轻 办 公 ， 可 以 选择 收费 的 Textastic 应 用 ， 它 可 以 完美 地 配合 Working Copy 的 Git 工 作 流 程 ， 同 
时 支持 WebDAV 协 议 。 在 Linux 环 境 ，Go 语 言 纯 代码 编写 的 话 推 荐 Gtihub Atom 工 具 ， 如 果 是 
命令 行 的 老司 机 用 户 也 可 以 配置 自己 的 Vim/Emacs 开 发 环境 ， 调 试 环 境 依然 推荐 Visual Studio 
Code ° 


Windows: Notepad++ 


Notepad++ 是 Windows 操 作 系 统 下 严肃 程序 员 们 编写 代码 的 利器 ! Notepad++ 不 仅仅 免费 、 
体积 小 (安装 程序 7+MB) 、 启 动 迅速 ， 而 且 对 中 文 的 各 种 编码 支持 非常 友好 ， 支 持 众多 程序 
语言 的 语法 高 亮 ， 对 于 正则 表达 式 、 函 数列 表 、 多 工程 等 特性 也 有 不 错 的 支持 。 


首先 去 Notepad++ 的 官网 http:Wnotepad-plus-plus.org 下 载 最 新 的 安装 包 。 然 后 去 
https://github.com/chai2010/notepadplus-go 下 载 针 对 Go 语言 的 配置 文件 并 安装 。 需 要 说 明 
的 是 ， 对 于 Go 汇编 语言 用 户 来 说 ，notepadplus-go 是 目前 唯一 支持 Go 汇编 语言 语法 高 亮 和 函 
数列 表 的 开发 环境 。 


下 面 是 Go 语言 的 语法 高 亮 预 览 ， 其 中 右 侧 是 Go 有 函数 列表 : 
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[r4 go'g github 
r5elHP) MIO) BES) 


P E Scanner e 











Copyright 2014 <chaishushan{AT}gmail.com>. All rights reserved. 














£r 
// Use of this source code is governed by a BSD-style 
// 


license that can be found in the LICENSE file. 


// 


// WEBP is defined at: EncodeRGBA 
'» EncodeLosslessGray 


^7 EncodeLosslessRGBA 


k Package webp implements a decoder and encoder for WEBP images. 


// https://developers.google.com/speed/webp/docs/riff container 
package webp 


DO 全 


|o 
"o 


import ( 

— "image" 

| 

func GetInfo(data []byte) (width, height int, hasAlpha bool, err error) 
— return webpGetInfo (data) 

} 


func DecodeGray (data []byte) (m *image.Gray, err error) { 
— Opix, w, h, err := webpDecodeGray (data) 
一 人 人》 二 于 orr. l=- nil. i 
——3i——return 
=M 

= &image.Gray{ 
— Je pix pix, 
——i——Stride:-1-*-w, 
——i——Rect: image.Rect(0, 0, w, h), 
— 
— — return 


} 

















User Define File - go length : 1507 lines : 60 Ln:14 Col:1 Sel:0|0 


M 


下 面 是 Go 语言 汇编 的 语法 高 亮 预 览 : 其 中 右 侧 是 汇编 函数 列表 : 
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[f Cgo\gol7windows ; am di , 
ZAPA ASE 搜索 (S) 视图 (V) 格式 (M) ESU i AO) 运行 (R) P SAM ? x 
oOEB & s is &i4tSwii2acisa'w|*«six3|z 1 (Fu «| e o» | cs 


asm amd64. s | 
// Copyright 2009 The Go Authors. All rights reserved. 
//. Use of this source code is governed by a BSD-style EHE 


// license that can be found in the LICENSE file. T — G 
$ runtime:-breakpoint 


时 runtime-asminit 

















IP 




















#include "go asm.h" 
#include "go tls.h" 
finclude "funcdata.h" $ runtime-systemstack switch 
#include "textflag.h" ® runtime:systemstack 
$ runtime-morestack E 
TEXT runtime :rt0_go (SB) ,NOSPLIT, $d| Y runtime morestack_nocbd 
二 *» runtime'stackBarrier 
——2// copy arguments forward on an even stack 
:MOVQ DI, AX >// argc 
—>MOVQ—>SI, BX— ——// argv 
—>SUBQ—>$ (4*8+7), SP — ——// 2args 2auto 
— ÓANDQ—$-15,.SP 
— SMOVQ— AX, 16(SP) 
——MOVQ —— BX, 24(SP) 


一 一 一 


OA OC Ui 5 wh 


m H 
NEBE O 





Pp 
QU a w 








H eee 
Q O0 - oO 


——2// create istack out of the given (operating system) stack 

——25//: cgo init may update stackguard. 

一 一 MOVQ —— Sruntime -g0 (SB), DI 

— —LEAQ ——» (-64*1024-104) (SP), BX :6 runtime:setcallerpc 

——2MOVQ ——BX, g stackguard0 (DI) *» runtime:getcallersp 

——2MOVQ ——BX, g stackguardl (DI) : étiam 
runtime:memhash varlen 

—— —MOVQ —BX, Oe (DI) 二 

一 一 MOVQ ——SP, (g stacktstack hi) (DI) € runtime-aeshashstr 

$ runtime:-aeshashbody 


NN INN OIN IS 
Ut NN Hmn| o 











length : 47622 lines : 2119 Ln:10 Col:35 Sel:0|0 


对 于 Protobuf 或 GRPC 的 用 户 ， 可 以 从 https://github.com/chai2010/notepadplus-protobuf 下 
载 相应 的 插件 。 


下 面 是 Protobuf 的 语法 高 亮 预览 : 
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I CAgo\gopkg\bin google\proto oufiwrappers.proto - Notepad? = | 7» n] 
文件 (P ”编辑 (E) 搜索 (S$) 视图 (V) 格式 (M) ESO 设置 (1) z(O) 运行 (R) 插件 (P) SAWM ? Xx 
































o B »s&|4Si|23c|s.| t sic s "(Era GJ[E) ie i E SE 9 Eg Search er & Prefer 
TE] wrappers. prote | 国 数 功 能 x 
M 36 syntax - "proto3"; A om 

37 B- = wrappers.proto 

8 package google.protobuf; 9 DoublaVahia 

20 9 FloatValue 

z 时 Int64Value 

40 option java multiple files = true; *» Ulnt64Value 

41 option java outer classname = "WrappersProto"; * Int32Value 
| 42 option java package = "com.google.protobuf"; Fran 
| 43 option csharp namespace = "Google.ProtocolBuffers"; 9 StringValue 

44 option objc class prefix = "GPB"; *» BytesValue 

45 
中 46 

47 // Wrapper message for double. 
|| 48 message DoubleValue { E 
| 49 // The double value. 

50 double value = 1; 

PEN 

5 // Wrapper message for float. 
I 54 message FloatValue { 

55 // The float value. 

I 6 float value = 1; 
E NE. 
59 // Wrapper message for int64. 
| 60 message Int64Value { 
// The int64 value. 
V int&4A walne = 1- " 1 " m 
|User Define File - protobuf length: 3040 lines : 100 Ln:10 Col:9 Sel:0|0 UNIX ANSI INS 





配置 Notepad++ 的 语法 高 亮 


Notepad++ 从 v6.2 版 本 之 后 ， 用 户 自 定义 语言 文件 userDefineLang.xml 改 用 UpL2 语法 ， 这 些 
的 配置 文件 全 部 采用 的 是 新 的 UDL2 的 语法 。 


如 果 是 通过 Notepad++ 安 装 程序 安装 的 ， 需 要 将 userpefineLang.xml 文件 中 的 内 容 添加 
到 %APPDATA%\Notepad++\userDefineLang. xml 文件 中 ， 放 在 «NotepadPlus» ... 
«/NotepadPlus» 标签 中 间 ， 然 后 重启 Notepad++ 程 序 。 


如 果 是 从 Notepad++ zip/7z 压 缩 包 解压 绿色 安装 ， 配 置 文件 userDefineLang.xml 在 解压 目录 。 
配置 Notepad++ 函 数列 表 支 持 


函数 列表 功能 是 Notepad++ v6.4 新 增加 的 特性 ， 配 置 方 法 和 语法 高 完 的 配置 过 程 类 似 。 需 要 
注意 的 是 v6.4 和 V6.5 对 应 的 «associationMap»...«/associationMap» 配置 语法 稍 有 不 同 ， 上 有 具体 请 
参考 functionList.xml 文件 中 的 注释 说 明 。 


如 果 是 采用 Notepad++ 安 装 程序 安装 的 ， 需 要 将 functionList.xml 文件 中 的 内 容 添加 
到 %APPDATA%NANotepad++N\functionList.xml 文件 中 ， 放 到 <associationMap> ... 
</associationMap> 和 «parsers» ... </parsers> 标签 中 间 ， 然 后 重启 Notepad++ 程 序 。 


如 果 是 从 Notepad++ zip/7z 压 缩 包 解压 绿色 安装 ， 配 置 文件 functionList.xml 在 解压 目录 。 


Notepad++ E i Zt & E sab 


Notepad++ 还 支持 关键 字 的 自动 补 人 全。 假设 Notepad++ 安 装 在 <DIR> 目录 ， 将 go.xml 文件 复 
制 到 <DIR>\plugins\APIs 目录 下 ， 然 后 重启 Notepad++ 程 序 。 


下 面 是 内 置 函 数 printin 自动 补 全 后 函数 参数 提示 的 预览 图 : 


func main() { 
println( 
4 ) printl:i args <a- Type 


这 是 一 个 比较 鸡肋 的 功能 ， 建 议 用 户 根据 自己 需要 选择 安装 。 


令 行 窗 


对 于 Go 语言 开发 来 说 ， 需 要 经 常 在 命令 行 运行 go fmt ^ go test ^ go run x.go 等 辅助 工 
具 。 虽 然 Notepad++ 也 可 以 将 这 些 工具 配置 成 标准 的 菜单 中 ， 但 是 命令 行 依然 是 不 可 缺少 的 
开发 环境 。 


自 带 的 命令 行 工 具 比 较 简陋 ， 不 是 理想 的 命令 行 开发 环境 。 如 果 读 者 还 没有 自 
已 合适 命令 行 环 境 ， 可 以 试 试 ConEmu 这 个 免费 命令 行 软件 。ConEmu 支 持 多 标签 页 窗口 ， 复 
制 粘 is 比较 方便 。 下 面 是 ConEmu 的 预览 图 





T MINGW32:- -uNH 


Eä «1» Vs2012| db «2» MsysGit | £3] «3» PowerShell | ff «4» PowerShell Ed " i * ER ILI 





rshel1.ConsealeHost+Con 


FILES 


.exe -a--- ] at2 .txt 
Xt acRdunp -a--- 1 a. s xm 


Sce. jp 


38 "mex: txt 


$ PS T:\Far3> [] E 
sh.exe:3112 « 131016[32] 2/4 [+] CAPS NUM SCRL PRIf (0,57)-155,73) 56x17 56x1000 73 25V 10648 100% 











ConEmu 的 主页 在 : http://conemu.github.io/ ° 


macOS: TextMate 


对 于 macOS 平 台 的 用 户 ， 免 费 的 轻 量 级 编辑 器 软件 推荐 TextMate。TextMate 是 macOS 下 的 
Notepadd++ 工 具 。 支 持 目录 列表 ， 支 持 Go 语 言 的 诸多 特性 。 下 面 是 TextMate 的 预览 图 : 





eoe LJ goobj.go — cgo (git: master) 
cgo.go file.go goobj.go 十 
M cgo “I< è| 1 ||/ Copyright 2016 <chaishushan{AT}gmail.com>. All rights reserved. 
[E] C. error.cc 2 // Use of this source code is governed by a BSD-style 
7^ e error.h // license that can be found in the LICENSE file. 
三 Rm S package cgo 
| c.string.h 
ub cgo.go x iw import ( 
4p char.go 8 "sync" 
ub error test.go Jáj ) 
nen B type objectra int32 
Qu file.go yP J ^ 
(Jj goobj.go x i3w| var refs struct ( 
|& README.md 14 sync.Mutex 
ub string list.go 15 objs map[ObjectId]interface(] 
[È string test.go =: , next ObjectId 
ub string.go 3 z 
ij types.go 19w| func init() { 
ub void pointer.go 8 refs.Lock() 
1 defer refs.Unlock() 
refs.objs = make(map[ObjectId]interfacei)) 
24 refs.next = 1000 
25A| } 
iw func NewObjectId(obj interface()) ObjectId ( 
3 refs.Lock() 
defer refs.Unlock() 
id := refs.next 
7 refs. next++ 
+i% Cay py | Line: 1| Go S| TabSize: 4v| 4*2 $1®@ 





对 于 iPad Pro 用 户 ， 目 前 也 有 不 少 编辑 软件 对 Go 语言 提供 了 不 错 的 支持 。 比 如 Textastic 
Code、Coda 等 ， 很 多 都 支持 iPad 和 macOS 平 台 的 同步 ， 它们 一 般 都 是 需要 单独 购买 的 收费 
软件 。 


IOS: Textastic 


Textastic 是 一 款 收 费 应 用 ， 它 是 macOS/iOS 下 著名 的 轻 量 级 代码 编辑 工具 ， 支 持 包 含 Go 语 言 
在 内 的 多 达 80 多 种 编程 语言 的 高 亮 显 示 。Textastic 功 能 特点 有 : 


e 匀 法 高 亮 ， 同 时 支持 80 余 种 语言 

。 5TextMate4] ik x 3,0 MÄR 

e *THTML ` CSS ` JavaScript ` PHP ` C ` Objective-C x 44 B 3h ib 4 489 
e Symbol list 快 速 导 航 内 容 

e 自动 保存 代码 和 版 本 

e iCloud F} (Mountain Lion only) 
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在 macOS 下 ，Textastic 的 界面 和 TextMate 非 常 相似 。 不 过 Textastic 在 左边 侧 栏 提供 了 基于 工 
程 的 检索 工具 。 下 面 是 macOS 下 Textastic 的 预览 图 


e^e 4 Cgo.go 
Folders Find cgo.go char.go goobj.go 
» D gobook // Copyright 2616 «chaishushan(AT)gmail.com». All rights reserved. 
vi // Use of this source code is governed by a BSD-style 
auo // license that can be found in the LICENSE fíle. 
» D git 
// export cgo functions for go test 
€» C error.cc 
用 c. error.h package cgo 
€» C.string.cc /» 
i #cgo CXXFLAGS: -std=c++11 
W c.string.h 1 
-suing #cgo windows LDFLAGS: -Wl,--allow-aeultiple-definition 
* Cgo.go 
ha */ 
» char.go : | import "C" 
- error.go import "unsafe" 
4 error.test.go // Go string to C string 
4 file.go // The C string is allocated in the C heap using malloc 
// 1t is the caller's responsibility to arrange for it to be 
^ // freed, such as by calling C.free (be sure to include stdlib.h 
f C.free is needed). 
README.md HS 
func CString(s string) *Char ( 
- string.go return (wChar)(C.CString(s)) 
* string list.go } 
4 string test.go // Go []byte slice to C array 
// The C array is allocated in the C heap using malloc. 
^ types.go // It is the caller's responsibility to arrange for it to be 
* void pointer.go // freed, such as by calling C.free (be sure to include stdlib.h 


//| if C.free is needed). 
func CBytes(s []byte) unsafe.Pointer ( 
return C.CBytes(s) 


// C string to Go string 
func GoString(s *Char) string ( 
return C.GoString((*C.char) (s)) 


// C data with explicit length to Go string 
func GoStringN(s *Char, n int) string ( 
return C.GoStringN((*C.char)(s), C.int(n)) 


// C data with explicit length to Go []byte 
func GoBytes(p unsafe.Pointer, n int) [jbyte { 
return C.GoBytes(p, C.intí(n)) 





11 Column 1 | Go © | LF (Unix) $ | Unicode (UTF-8) S | «No symbois» $ 





因为 iOS 环 境 不 支持 编译 和 调试 ， 如 果 需 要 在 iOS 环 境 编写 d ,首先 要 解决 和 其 他 平台 的 
共享 问题 。 这 样 可 以 在 iOS 环 境 编写 代码 ， 然 后 在 其 他 电脑 上 进行 编译 和 测试 。 


最 简单 的 共享 方式 是 在 jiCloud 的 Textastic 专 有 的 目录 中 创建 Go 语言 的 工作 区 目录 ， 然 后 通过 


iCloud 方 案 实现 和 其 他 平台 共享 。 此 外 ， 还 可 以 通过 WebDAV 标 准 协 议 来 实现 文件 的 共享 ， 常 
LANA UR PRDAV LA 。 另 外， 用 Go 语言 也 能 很 容易 实现 一 个 
WebDAV 的 服务 器 ， 具 体 请 参考 第 七 章 中 WebDAV 的 相关 主题 。 

下 面 是 iPad Pro 下 Textastic 的 预览 图 
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D tr dd 2016/11/3 F¥9:20 
|^ char.go 


^ error test.go 
error.go 
file.go 
goobj.go 

^ README.md 

N string list.go 
string, test.go 


pes go 


void pointer.go 





// Copyright 2016 «chaishushan(AT)gmail.com». All rights reservec 
// Use of thís source code is governed by a BSD-style 
// license that can be found in the LICENSE file. 


// export cgo functions for go test 


package cgo 


/* 
#cgo CXXFLAGS: -stdece«11 
zcgo windows LDFLAGS: -Wl,--allow-multiple-definition 


*/ 
import "C" 
import "unsafe" 


// Go string to C string 
// The C string is allocated in the C heap using malloc. 
// It is the caller's responsibility to arrange for it to be 
// freed, such as by calling C.free (be sure to include stdlib.h 
// if C.free is needed). 
func CString(s string) »Char ( 
return (*Char)(C.CString(s)) 


// Go []byte slice to C array 
// The C array is allocated in the C heap using malloc. 
// It is the caller's responsibility to arrange for it to be 
// freed, such as by calling C.free (be sure to include stdlib.h 
// if C.free is needed). 
func CBytes(s []byte) unsafe.Pointer ( 
return C.CBytes(s) 


// C string to Go string 
func GoString(s »Char) string ( 
return C.GoString((»C. char) (s)) 


// C data with explicit length to Go string 
func GoStringN(s *»Char, n int) string ( 
return C.GoStringN((*C.char) (s), C.int(n)) 


// C data with explicit length to Go []byte 

func GoBytes(p unsafe.Pointer, n int) []byte { 
return C.GoBytes(p, C.int(n)) 

) 





File Properties 


Filename 


CQgo.go 


LINKS TO REMOTE CONNECTIONS 


Not Linked 


Textastic saves the used connection and remote path when 
downloading or uploading files. 


FILE ATTRIBUTES 


File Size 
Modified 

TEXT PROPERTIES 
Encoding 

Line Endings 


Syntax Definition 


Line Count 
Character Count 


Word Count 


13 KB 


2016 年 11 





Unicode (UTF-8) 


Unix (LF) 


如 果 Go 语 言 代码 是 放 在 Git 服 务 器 中 ， 可 以 通过 Working Copy 应 用 将 仓库 克隆 到 iOS 中 ， 然 后 
再 Textastic 中 通过 iOS 协 议 打 开工 作 区 文件 。 编 辑 完成 之 后 ， 在 通过 Working Copy 将 修改 提交 


到 中 心 仓库 中 。 


下 面 是 iPad Pro 下 Working Copy 查 看 Git 更 新 日 志 的 预览 图 


1.8. 配置 开发 环境 
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iPad * 下 年 9-47 75% m’ 


« cgo [w«] - « 口 [atroces] Q 



































Repository Ímaster) (originimaster! add bute cgo helper 
Status and Configuration 
master branch & chai2010 48814422e0ce07691042525840705689a4b522e6 2016/9/9 
c error.cc - 
fix build 
C. error.h ^ 
p" chai2010 65024504880bb5d259e44d1a494b15e38eb442712 2016/9/8 
C. string.cc add x. First method. 
c. string.h a chai2010 79c25de736df7c84(49c12tcd43d9eac0a5td3ed 2016/9/8 
Support Got 6 
cgo.go 
â chai2010 5ac5dace72240100442027551b313091b6dc7155! 2016/8/23 
char.go ` J 
add Bool type 
error test.go ) ow 
p" chai2010 07602e547ba744b03035515321e06200c36c3938 2016/8/22 
error.go D 
file.go A chai2010 94655479314217331142abea7dd9e571e010584c 2016/8/12 
goobj.go fix VoidPointer 
README md & chai2010 8884d112ad731903ab9a114978b7623be73dB8bec8 2016/8/12 
m 
VoidPointer: add GoString/GoStringN 
string, list.go 
a chai2010 Be0b51b17119065ee1c8ac63082a7b0bcd195a2ca 2016/8/12 





string, test.go 
add error test 


string.go ls 








É cizo dó0daBbc686e57a32cacOeSeaücdbeBbbBacO2ce 2016/8/12 
types.go [add string test 
vold. pointer.go A hioo fe2cS0cb3fa30488bc0d417db7e23327dd356615 2016/8/12 








Char.Slice use sirien as default length 


A cnai2010 6f92c391c1168c149881274095209281c7c039 2016/8/12 


跨 平 台 编 辑 器 : Github Atom 


Gtihub Atom 是 Github 专 门 为 程序 员 推 出 的 一 个 跨 平台 文本 编辑 器 。 具 有 简洁 和 直观 的 图 形 用 
户 界面 ， 内置 支持 Go 语言 语法 高 亮 。 同 时 Github Atom 支 持 宏 、 自 动 完成 分 屏 功 能 ， 同 时 集成 
了 文件 管理 器 ， 对 于 macOS 和 Linux 用 户 来 说 是 一 个 优秀 的 Go 语言 编辑 器 。 


Github Atom 的 预览 图 
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ece 4 gooti go — cgo — /Usersjchaishushan/gopkg/src/github.com/chai20 10/090 


D ow à fie go en w ^ WE geotige x Vi grotigo a Gi ererge 
1 
c wh 
i package cgo package 

€ comm £ 

import | 
hid isport 
al c 
E ern type Er E 
Bu type tid int 
z 12 func New j E 
一 truct retura (+E 
`“ x eC. c 

READMM ap [00] € dlinterface 

, s I func NewErrorfros t t t 
Sa sr s 1- Newtha g 
res defe Free 

fuac in 
"u r retu F 
ww def. E 

DE 
type File C.FILE 





Github Atom 作 为 一 个 Go 语言 编辑 器 ， 不 足 之 处 是 没有 Go 汇编 语言 的 高 亮 显 示 插 件 。 而 且 
Github Atom 对 于 大 文件 的 支持 ， 性 能 不 是 很 好 。 


跨 平 台 IDE: Visual Studio Code 


Visual Studio Code 是 微软 推出 的 轻 量 级 跨 平 台 集 成 开发 环境 ， 简 称 VSCode。VSCode 最 初 的 
目的 是 支持 JavaScript 和 TypeScript 开 发 ， 但 是 它 和 逐步 增加 了 第 三 方 编程 语言 的 支持 ， 目 前 它 
已 经 可 以 说 是 最 完美 的 Go 语言 集成 开发 环境 了 。 


VSCode 虽 然 是 基于 Gtihub Atom 而 来 ， 不 过 VSCode 支 持 Go 语 言 的 代码 自动 补 全 和 调试 功 
能 ， 因 此 已 经 超越 Github Atom 单 作为 编辑 器 的 定位 ， 是 一 个 轻 量 级 的 集成 开发 环境 。 
VSCode 对 于 大 文件 的 支持 也 比 Gtihub Atom 优 秀 很 多 。 


下 面 是 用 VScode 打 开 的 Go 语言 工程 的 预览 图 : 


decodeShapev4l(v, Shape) 


[1PT. 30EX 


5: tAssertNesr failed, expecte 





Am, E id 


因为 ，VSCode 和 Gtihub Atom 都 是 采用 的 Chrome 核 心 ， 它 不 仅仅 能 编辑 显示 代码 ， 还 可 以 用 
来 显示 网 页 查看 图 像 ， 甚 至 可 以 在 一 个 分 屏 窗口 中 播放 视频 文件 : 


就 像 20 年 代为 将 酬 和 工时 而 举行 的 
Like the big AmosKeag strike in the 1920s 





VSCode 安 装 Go 语 言 插 件 中 ， 默 认 的 很 多 参数 设置 比较 严格 。 比 如 ， 默 认 会 使 用 golint 来 严 
格 检查 代码 是 否 符 合 编码 规范 ， 对 于 git 工 程 启 动 时 还 会 自动 获取 和 有 刷 新。 对 于 一 般 的 Go 语言 

代码 来 说 ， golint 检测 过 于 严格 ， 很 难 完全 通过 (Go 语言 标准 库 也 无 法 完全 通过 ) ， 从 而 导 
致 每 次 保存 时 都 会 提示 很 多 干扰 人 信息。 当然， 对 相对 稳定 的 程序 定期 做 golint 检查 也 是 有 必 
要 ， 它 的 信息 可 以 作为 我 们 改进 代码 的 参考 。 同 样 的 ， 如 果 git 仓 库 有 密码 认证 的 话 ，VSCode 
在 启动 的 时 候 总 是 弹出 输入 密码 的 对 话 框 。 


我 们 可 以 在 工程 目录 的 .vscode/settings.json 配置 文件 中 定制 这 些 选 项 。 下 面 配 置 是 强制 在 
保存 的 时 候 采用 gofmt 格式 化 代码 ， 并 且 关闭 保存 时 golint 检查 。 同 时 在 VSCode 刚 启动 的 
时 候 ， 禁 止 Git 自 动 刷 新 和 获取 操作 。 


// 将 设置 放 入 此 文件 中 以 覆盖 默认 值 和 用 户 设置 。 


t 
// Pick 'gofmt', 'goimports' or 'goreturns' to run on format. 
"go.formatTool": "gofmt", 
// [EXPERIMENTAL] Run formatting tool on save. 
"go.formatOnSave": true, 
// Run 'golint' on save. 
"go.lintonSave": false, 
qvteautonefresh false, 
"git.autofetch": false 
} 


VSCode 作 为 一 个 专业 的 Go 语言 集成 开发 环境 , 稍 显 不 足 之 处 是 没有 Go 汇编 语言 的 高 完 显 示 
插件 。 


AN 


第 二 章 CGO 编程 


C/C++ 经 过 几 十 年 的 发 展 ， 已 经 积累 了 庞大 的 软件 资产 ， 它 们 很 多 久 经 考验 而 且 性 能 已 经 足够 
优化 。Go 语 言 必须 能 够 站 在 C/C++ 这 个 巨人 的 肩膀 之 上 ， 有 了 海量 的 C/C++ 软件 资产 狗 底 之 
后 ， 我 们 才 可 以 放心 愉快 地 用 Go 语言 编程 。C 语 言 作为 一 个 通用 语言 ， 很 多 库 会 选择 提供 一 
个 C 兼 容 的 API， 然 后 用 其 他 不 同 的 编程 语言 实现 。Go 语 言 通 过 自 带 的 一 个 叫 CGO 的 工具 来 
支持 C 语 言 函 数 调用 ， 同 时 我 们 可 以 用 Go 语言 导出 C 动 态 库 接口 给 其 它 语言 使 用 。 本 章 主 要 讨 
论 CGO 编 程 中 涉及 的 一 些 问题 。 


2.1. 快速 入 门 


在 第 一 章 的 “Hello, World 的 革命 "一 节 中 ， 我 们 已 经 见 过 一 个 CGO 程序 。 本 节 我 们 将 通过 由 浅 
入 深 的 一 系列 小 例子 来 快速 掌握 CGO 的 基本 用 法 。 


最 简 CGO 程 序 


真实 的 CGO 程序 一 般 都 比较 复杂 。 不 过 我 们 可 以 反 其 道 而 行 之 ， 一 个 最 简 的 CGO 程序 该 是 什 
么 样 的 呢 ? 要 构造 一 个 最 简 CGO 程 序 ， 首 先 要 去 掉 一 些 复杂 的 CGO 特性 ， 同 时 要 展示 CGO 程 
序 和 纯 Go 程 序 的 差别 来 。 下 面 是 我 们 构建 的 最 简 CGO 程 序 : 


import "C" 
func main() { 


println("hello cgo") 
} 


代码 通过 import "c" 语句 局 用 CGO 特性 ， 主 函数 只 是 通过 Go 内 置 的 printlIn 函 数 输出 字符 串 ， 
其 中 并 没有 任何 和 CGO 相关 的 代码 。 虽 然 用 CGO 的 相关 函数 ， 但 是 go build 命 令 会 在 
编译 和 链接 阶段 启动 gcc 编 译 器 ， 这 已 经 是 完整 的 CGO 程 序 了 。 


基于 C 标 准 库 函数 输出 字符 串 
一 章 那 个 CGO 程 序 还 不 够 简单 ， 我 们 现在 来 看 看 更 简单 的 版 本 : 


package main 


//#include <stdio.h> 


import "C" 


func main() { 
C.puts(C.CString("Hello, WorldNin")) 


} 


我 们 不 仅仅 通过 import "c" 语句 启用 CGO 特 性 ， 同 时 包含 C 语 言 的 <stdio.h> 头 文 件 。 然 后 
通过 CGO 包 的 c.cstring 函数 将 Go 语言 PIERA I e ， 最 后 调用 C 语 言 
的 c.puts 子 数 向 标准 输出 窗口 打印 转换 后 的 C 字 符 串 。 


相 比 “Hello, World 的 革命 "一 节 中 的 CGO 程序 最 大 的 不 同 是 : 我 们 没有 在 程序 退出 前 释 
放 c.cstring 创建 的 C 语 言 字符 串 ; 还 有 我 们 改 用 puts 函数 直接 向 标准 输出 打印 ， 之 前 是 采 
用 fputs 向 标准 输出 打印 。 


没有 释放 使 用 c.cstring 创建 的 C 语 言 字符 串 会 导致 内 存 泄 露 。 但 是 对 于 这 个 小 程序 来 说 ， 这 
样 是 没有 问题 的 ， 因 为 程序 退出 后 操作 系统 会 自动 回收 程序 的 所 有 资源 。 
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前 面 我 们 使 用 了 标准 库 中 已 有 的 函数 。 现 在 我 们 先 自 定义 一 个 叫 sayHello 的 C 函 数 来 实现 打 
印 ， 然 后 从 Go 语言 环境 中 调用 这 个 sayHello 函数 : 


package main 


"t 


4include <stdio.h> 


static void SayHello(const char* s) { 
puts(s)" 


- 
了 


K 
amportes cs 


func main() { 
C.SayHello(C.CString("Hello, WorldNn")) 


} 
除了 sayHello 函数 是 我 们 自己 实现 的 之 外 ， 其 它 的 部 分 和 前 面 的 例子 基本 相似 。 
我 们 也 可 以 将 sayHello 函数 放 到 当前 目录 下 的 一 个 C 语 言 源 文 件 中 〈 后 绥 名 必须 是 .c ) 。 
因为 是 编写 在 独立 的 C 文 件 中 ， 为 了 人 允许 外 部 引用 ， 所 以 需要 去 掉 函 数 的 static 修饰 符 。 

// hello.c 

zinclude <stdio.h> 

void SayHello(const char* s) ( 


puts(s); 
} 


然后 在 CGO 部 分 先 声 明 sayHello 函数 ， 其 它 部 分 不 变 : 


package main 


//void SayHello(const char* s); 
ampormtes co 


func main() { 
C.SayHello(C.CString("Hello, Worldin")) 


} 


既然 sayHello 函数 已 经 放 到 独立 的 C 文 件 中 了 ， 我 们 自然 可 以 将 对 应 的 C 文 件 编译 打包 为 静态 
库 或 动态 库 文件 供 使 用 。 如 果 是 以 静态 库 或 动态 库 方式 引用 sayHello 函数 的 话 ， 需 要 将 对 应 
的 C 源 文件 移出 当前 目录 〈CGO 构 建 程序 会 自动 构建 当前 目录 下 的 C 源 文件 ， 从 而 寻 致 C 函 数 
名 冲突 ) 。 关 于 静态 库 等 细节 将 在 稍 后 章节 讲解 。 


C 代 码 的 模块 化 


在 编程 过 程 中 ， 抽 象 和 模块 化 是 将 复杂 问题 简化 的 通用 手段 。 当 代码 语句 变 多 时 ， 我 们 可 以 
将 相似 的 代码 封装 到 一 个 个 函数 中 ; 当 程序 中 的 函数 变 多 时 ， 我 们 将 函数 拆 分 到 不 同 的 文件 
或 模块 中 。 而 模块 化 编程 的 核心 是 面向 程序 接口 编程 (这 里 的 接口 并 不 是 GO 语言 的 
interface ， 而 是 API 的 概念 ) ° 


在 前 面 的 例子 中 ， 我 们 可 以 抽象 一 个 名 为 hello 的 模块 ， 模 块 的 全 部 接口 函数 都 在 hello.h 头 文 
件 定 义 : 


ZA yeso 
void SayHello(const char* s); 


vA —^SayHello A žig 5 9] » 4j E79 hello A ig A P Ab * 3b 9T A2 RU HI 
SayHello 有 函数 ， 二 无 需 关 心 函数 的 具体 实现 。 而 作为 SayHello 函 数 的 实现 者 来 说 ， 函 数 的 实 
现 只 要 满足 头 文件 中 函数 的 声明 的 规范 即 可 。 下 面 是 SayHello 有 函数 的 C 语 言 实 现 ， 对 应 hello.c 
文件 : 


hellosc 
zinclude "hello.h" 
void SayHello(const char* s) ( 


puts(s); 
} 


在 hello.c 文 件 的 开头 ， 实 现 者 通过 #include "hello.h" 语句 包含 SayHello 苑 数 声 明 的 签名 ， 这 
样 可 以 保证 函数 的 实现 满足 模块 对 外 公开 的 接口 。 


接口 文件 hello.h 是 hello 模 块 的 实现 者 和 使 用 者 共同 的 约定 ， 但 是 该 约定 并 没有 要 求 必 须 使 用 C 
语言 来 实现 SayHello 有 函数 。 我 们 也 可 以 用 C++ 语言 来 重新 实现 这 个 C 语 言 函 数 : 


// hello.cpp 
include <iostream> 


extern "C" [f 
4include "hello.h" 


} 


void SayHello(const char* s) ( 
std::cout << sS; 


} 


在 C++ 版 本 的 SayHello 函 数 实现 中 ， 我 们 通过 C++ 特有 的 std::cout 输出 流 输出 字符 串 。 不 过 
为 了 保证 C++ 语言 实现 的 SayHello 函 数 满足 C 语 言 头 文件 hello.h 定 义 的 函数 规范 ， 我 们 需要 通 
过 extern "c" 语句 指示 该 函数 的 链接 符号 遵循 C 语 言 的 名 字 修 身 规则 。 

在 采用 面向 Ci 语言 API 接 口 编程 之 后 ， 我 们 彻底 解放 了 模块 实现 者 的 语言 柳 锁 : 实现 者 可 以 用 
任何 编程 语言 实现 模块 ， 只 要 最 终 满 足 公 开 的 API 约 定 即 可 。 我 们 可 以 用 C 语 言 实现 SayHello 
函数 ， 也 可 以 使 用 更 复杂 的 C++ 语言 来 实现 SayHello 有 函数 ， 当 然 我 们 也 可 以 用 汇编 语言 甚至 
Go 语言 来 重新 实现 SayHello 有 函数 。 


用 Go 重新 实现 C 有 函数 


其 实 CGO 不 仅仅 用 于 Go 语言 中 调用 C 语 言 函 数 ， 还 可 以 用 于 导出 Go 语言 函数 给 C 语 言 函 数 调 
用 。 在 前 面 的 例子 中 ， 我 们 已 经 抽象 一 个 名 为 hello 的 模块 ， 模块 的 全 部 接口 函数 都 在 hello.h 
头 文件 定义 : 


// hello.h 
void SayHello(/*const*/ char* s); 


现在 我 们 创建 一 个 hello.go 文 件 来 用 Go 语言 重新 实现 C 语 言 接口 的 SayHello 函 数 : 


// hello.go 


package main 


//export SayHello 
func SayHello(s *C.char) { 
fmt.Print(C.GoString(s)) 


} 


我 们 通过 CGO 的 //export sayHello 指令 将 Go 语言 实现 的 函数 sayHello 导出 为 C 语 言 函 数 。 
为 了 适 配 CGO 导 出 的 C 语 言 函 数 ， 我 们 禁止 了 在 泡 数 的 声明 语句 中 的 const 修 饰 符 。 需 要 注意 
的 是 ， 这 里 其 实 有 两 个 版 本 的 sayHello Hk: 一 个 Go 语言 环境 的 ; 另 一 个 是 C 语 言 环境 的 。 
cg0 生 成 的 C 语 言 版 本 SayHello 远 数 最 终 会 通过 桥接 代码 调用 Go 语言 版 本 的 SayHello 却 数 。 


通过 面向 C 语 言 接口 的 编程 技术 ， 我 们 不 仅仅 解放 了 函数 的 实现 者 ， 同 时 也 简化 的 函数 的 使 用 
者 。 现 在 我 们 可 以 将 SayHello 当 作 一 个 标准 库 的 函数 使 用 (和 puts 函 数 的 使 用 方式 类 似 ) 
package main 


//#include <hello.h> 


amp ote cu 


func main() { 
C.SayHello(C.CString("Hello, Worldin")) 
H 


一 切 似乎 都 回 到 了 开始 的 CGO 代码 ， 但 是 代码 内 涵 更 丰富 了 。 


面向 C 接 口 的 Go 编程 


在 开始 的 例子 中 ， 我 们 的 全 部 CGO 代码 都 在 一 个 Go 文件 中 。 然 后 ， 通 过 面向 C 接 口 编程 的 技 
术 将 SayHello 分 别 拆 分 到 不 同 的 C 文 件 ， 而 main 依 然 是 Go 文件 。 再 然后 ， 是 用 Go 兄 数 重新 实 
现 了 C 语 言 接口 的 SayHello 有 函数 。 但 是 对 于 目前 的 例子 来 说 只 有 一 个 函数 ， 要 拆 分 到 三 个 不 同 
W LAARA EKT o 


正 所 谓 合 久 必 分 、 分 久 必 合 ， 我 们 现在 尝试 将 例子 中 的 几 个 文件 重新 合并 到 一 个 Go 文件 。 下 
面 是 合并 后 的 成 果 : 


package main 


//void SayHello(char* s); 
Import ee 


import ( 
E m T i ea 
) 


func main() { 


C.SayHello(C.CString("Hello, 


} 


//export SayHello 
func SayHello(s *C.char) { 
fmt.Print(C.GoString(s)) 


} 


现在 版 本 的 CGO 代码 中 C 语 言 代 码 的 比例 已 经 很 少 了 ， 但 是 我 们 依然 可 以 进一步 


思维 来 提炼 我 们 的 CGO 代码 。 通 过 


// *build go1.10 
package main 


//void SayHello( GoString s); 
import euei 


import ( 
下 二 全 七 所 
) 


func main() { 


C.SayHello("Hello, World\n") 


} 


//export SayHello 
func SayHello(s string) { 
fmt.Print(s) 


} 


虽然 看 起 来 全 部 是 Go 语言 代码 ， 但 是 执行 的 时 候 是 先 从 Go 语言 的 main 函数 ， 
成 的 C 语 言 版 本 sayHello 桥接 函数 ， 


WorldNn")) 


以 Go 语言 的 


过 分 析 可 以 发 现 sayHello 函数 的 参数 如 果 可 以 直接 使 用 Go 
SHIRRES 。 在 Go1.10 中 CGO 新 增加 了 一 个 _costring 预定 义 的 C 语 言 类 型 ， 用 来 表 
示 Go 语 言 字 符 串 。 下 面 是 改进 后 的 代码 : 


最 后 又 回 到 了 Go 语言 环境 的 SayHello 函数 。 


包含 了 CGO 编程 的 精华 ， 读 者 需要 深入 理解 。 


思考 题 : main 有 函数 和 SayHello 有 函数 是 否 在 同一 个 Goroutine 只 执行 ? 


到 CGO 自动 生 


这 个 代码 
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2.2. CGO 基础 


要 使 用 CGO 特性 ， 需 要 安装 CC++ 构 建 工 具 链 ， 在 macOS 和 Linux 下 是 要 安装 GCC ， 在 
windows 下 是 需要 安装 MinGW 工 具 。 同 时 需要 保证 环境 变量 ceo ENABLED 被 设置 为 1， 这 表示 
CGO 是 被 启用 的 状态 。 在 本 地 构建 时 coo ENABLED 默认 是 启用 的 ， 当 交叉 构建 时 CGO 默认 是 
禁止 的 。 比 如 要 交 又 构建 ARM 环 境 运 行 的 Go 程序 ， 需 要 手工 设置 好 C/C++ 交 又 构建 的 工具 
链 ， 同 时 开启 coo ENABLED 环境 变量 。 然 后 通过 import "c" 语句 启用 CGO 特 性 。 


import "C" 语句 


如 果 在 Go 代码 中 出 现 了 import "c" 语句 则 表示 使 用 了 CGO 特 性 ， 紧 跟 在 这 行 语句 前 面 的 注 
释 是 一 种 特殊 语法 ， 里 面包 含 的 是 正常 的 C 语 言 代码 。 当 确保 CGO 启 用 的 情况 下 ， 还 可 以 在 
当前 目录 中 包含 C/C++ 对 应 的 源 文件 。 


举 个 最 简单 的 例子 : 


package main 


/* 


&include <stdio.h> 


void printint(int v) ( 
printf("printint: Nn v); 

} 

7 

import "C" 

import "unsafe" 


func main() { 
v := 42 
C.printint(C.int(v)) 


这 个 例子 展示 了 cgo 的 基本 使 用 方法 。 开 头 的 注释 中 写 了 要 调用 的 C 有 函数 和 相关 的 头 文件 ， 头 
文件 被 include 之 后 里 面 的 所 有 的 C 语 言 元 素 都 会 被 加 入 到 ”C” 这 个 虚拟 的 包 中 。 需 要 注意 的 
是 ，import "C" 寻 入 语句 需要 单独 一 行 ， 不 能 与 其 他 包 一 同 import。 向 C 函 数 传递 参数 也 很 简 
单 ， 就 直接 转化 成 对 应 C 语 言 类 型 传递 就 可 以 。 如 上 例 中 c.int(v) 用 于 将 一 个 Go 中 的 int 类 型 
值 强制 类 型 转换 转化 为 C 语 言 中 的 int 类 型 值 ， 然 后 调用 C 语 言 定 义 的 printint 函 数 进行 打印 。 
需要 注意 的 是 ，Go 是 强 类 型 语言 ， 所 以 cgo 中 传递 的 参数 类 型 必须 与 声明 的 类 型 完全 一 致 ， 
而 且 传递 前 必须 用 "C?" 中 的 转化 函数 转换 成 对 应 的 C 类 型 ， 不 能 直接 传 入 Go 中 类 型 的 变量 。 同 
时 通过 虚拟 的 C 包 导入 的 C 语 言 符号 并 不 需要 是 大 写字 母 开 头 ， 它 们 不 受 Go 语 言 的 导出 规则 约 


Žo 


cgo 将 当前 包 引 用 的 C 语 言 符号 都 放 到 了 虚拟 的 C 包 中 ， 同 时 当前 包 依 赖 的 其 它 Go 语 言 包 内 部 
可 能 也 通过 cgo 引 入 了 相似 的 虚拟 C 包 ， 但 是 不 同 的 Go 语言 包 引 入 的 虚拟 的 C 包 之 间 的 类 型 是 
不 能 通用 的 。 这 个 约束 对 于 要 自己 构造 一 些 cgo 辅 助 函 数 时 有 可 能 会 造成 一 点 的 影响 。 


比如 我 们 希望 在 Go 中 定义 一 个 C 语 言 字符 指针 对 应 的 CChar 类 型 ， 然 后 增加 一 个 GoString 方 法 
返回 Go 语言 字符 串 : 


package cgo helper 
import "C" 
type CChar C.char 


func (p *CChar) GoString() string { 
return C.GoString((*C.char)(p)) 
} 


func PrintCString(cs *C.char) { 
print(cs.GoString()) 
} 


现在 我 们 可 能 会 想 在 其 它 的 Go 语言 包 中 也 使 用 这 个 辅助 函数 : 


package main 


// static char* cs — "hello" 
Import aCi 
import =. /cgo helper: 


func main() { 
cgo helper.PrintCString(C.cs) 
} 


这 段 代 码 是 不 能 正常 工作 的 ， 因 为 当前 main 包 引入 的 c.cs 变量 的 类 型 是 当前 main 包 的 cgo 构 
造 的 虚拟 的 C 包 下 的 char 类 型 ， 它 和 cgo_helper 包 引入 的 *c.cnar 类 型 是 不 同 的 。 在 Go 语言 

中 方法 是 依附 于 类 型 存在 的 ， 不 同 Go 包 中 引入 的 虚拟 的 C 包 的 类 型 却 是 不 同 的 ， 这 导致 从 它 

们 延伸 出 来 的 Go 类 型 也 是 不 同 的 类 型 ， 这 最 终 导致 了 前 面 代码 不 能 正常 工作 。 


有 Go 语言 使 用 经 验 的 用 户 可 能 会 建议 参数 转型 后 再 传 入 。 但 是 这 个 方法 似乎 也 是 不 可 行 的 ， 

因为 cgo helper.PrintCString 的 参数 是 它 自 身 包 引入 的 *c.char 类 型 ， 在 外 部 是 无 法 直接 获 

取 这 个 类 型 的 。 换 言 之 ， 一 个 包 如 果 在 公开 的 接口 中 直接 使 用 了 *c.char 等 类 似 的 虚拟 C 包 的 
类 型 ， 其 它 的 Go 包 是 无 法 直接 使 用 这 些 类 型 的 ， 除 非 这 个 Go 包 同 时 也 提供 了 *c.char 类 型 的 
构造 函数 。 因 为 这 些 诸多 因素 ， 如 果 想 在 go test 环 境 直接 测试 这 些 cgo 导 出 的 类 型 也 会 有 相同 
的 限制 。 


#cgo i$ 6] 


在 import "c" 语句 前 的 注释 中 可 以 通过 4cgo 语句 设置 编译 阶段 和 链接 阶段 的 相关 参数 。 编 
译 阶段 的 参数 主要 用 于 定义 相关 宏和 指定 头 文件 检索 路 径 。 链 接 阶 段 的 参数 主要 是 指定 库 文 
件 检 索 路 径 和 要 链接 的 库 文件 。 





// #cgo CFLAGS: -DPNG DEBUG=1 -I./include 
GS: -L/usr/local/lib -lpng 

// &include «png.h» 

amportes cs 


上 面 的 代码 中 ，CFLAGS 部 分 ， -D HITELT PNG DEBUG » 4&1; -IT 定义 了 头 文件 
包含 的 检索 目录 。LDFLAGS 部 分 ， -L 指定 了 链接 时 库 文件 检索 目录 ， -1 指定 了 链接 时 需 
要 链接 png 库 。 

因为 C/C++ 遗留 的 问题 ，C 头 文件 检索 目录 可 以 是 相对 目录 ， 但 是 库 文件 检索 目录 则 需要 绝对 
路 径 。 在 库 文件 的 检索 目录 中 可 以 通过 ${SRCDIR} 变量 表示 当前 包 目 录 的 绝对 路 径 : 


// #cgo LDFLAGS: -L$(SRCDIRj/libs -lfoo 


上 面 的 代码 在 链接 时 将 被 展开 为 : 


// #cgo LDFLAGS: -L/go/src/foo/libs -lfoo 


#cgo 语句 主要 影响 CFLAGS、CPPFLAGS、CXXFLAGS、FFLAGS 和 LDFLAGS 几 个 编译 器 
环境 变量 。LDFLAGS 用 于 设置 链接 时 的 参数 ， 除 此 之 外 的 几 个 变量 用 于 改变 编译 阶段 的 构建 
参数 (CFLAGS 用 于 针对 C 语 言 代码 设置 编译 参数 ) 。 


对 于 在 cgo 环 境 混合 使 用 C 和 C++ 的 用 户 来 说 ， 可 能 有 三 种 不 同 的 编译 选项 : 其 中 CFLAGS 对 
应 C 语 言 特 有 的 编译 选项 、CXXFLAGS 对 应 是 C++ 特有 的 编译 选项 、CPPFLAGS 则 对 应 C 和 
C++ 共有 的 编译 选项 。 但 是 在 链接 阶段 ，C 和 C++ 的 链接 选项 是 通用 的 ， 因 此 这 个 时 候 已 经 不 
再 有 C 和 C++ 语言 的 区 别 ， 它 们 的 目标 文件 的 类 型 是 相同 的 。 

#cgo 指令 还 支持 条 件 选 择 ， 当 满足 某 个 操作 系统 或 某 个 CPU 架构 类 型 时 后 面 的 编译 或 链接 选 
项 生效 。 比 如 下 面 是 分 别针 对 Windows 和 非 windows 下 平台 的 编译 和 链接 选项 : 


// #cgo windows CFLAGS: -DX86-1 
// #cgo !windows LDFLAGS: -lm 


其 中 在 windows 平 台 下 ， 编 译 前 会 预定 义 X86 宏 为 1; 再 非 widnows 平 台 下 ， 在 链接 阶段 会 要 
求 链 接 math 数 学 库 。 这 种 用 法 对 于 在 不 同 平台 下 只 有 少数 编译 选项 差异 的 场景 比较 适用 。 


如 果 在 不 同 的 系统 下 cgo 对 应 着 不 同 的 C 代 码 ， 我 们 可 以 先 使 用 #cgo 指令 定义 不 同 的 C 语 言 的 
宏 ， 然 后 通过 宏 来 区 分 不 同 的 代码 : 

package main 

vit 

cgo windows CFLAGS: -DCGO OS WINDOWS-1 

4cgo darwin CFLAGS: -DCGO OS DARWIN-1 


cgo linux CFLAGS: -DCGO OS LINUX-1 


4if defined(CGO OS WINDOWS) 


static char* os - "windows"; 
Zelif defined(CGO OS DARWIN) 
static char* os - "darwin"; 
4elif defined(CGO OS LINUX) 
Static Chari OS TSATINUX A 
#else 
# error (unknown os) 
#endif 
S 
IMpPoOrt es 


func main() { 
print(C.GoString(C.os)) 
} 


这 样 我 们 就 可 以 用 C 语 言 中 常用 的 技术 来 处 理 不 同 平 台 之 间 的 差异 代码 。 


build tag 条 件 编 译 


build tag 是 在 Go 或 cgo 环 境 下 的 C/C++ 文 件 开头 的 一 种 特殊 的 注释 。 条 件 编译 类 似 于 前 面 通 
过 #cgo 指令 针对 不 同 平台 定义 的 宏 ， 只 有 在 对 应 平台 的 宏 被 定义 之 后 才 会 构建 对 应 的 代码 。 
但 是 通过 #cgo 指令 定义 宏 有 个 限制 ， 它 只 能 是 基于 Go 语言 支持 的 windows、darwin 和 |inux 等 
已 经 支持 的 操作 系统 。 如 果 我 们 希望 定义 一 个 DEBUG 标 志 的 宏 ，#cgo 指令 就 无 能 为 力 了 。 
而 Go 语言 提供 的 build tag 条 件 编译 特性 则 可 以 简单 做 到 。 


比如 下 面 的 源 文 件 只 有 在 设置 debug 构 建 标志 时 才 会 被 构建 : 
// *build debug 
package main 


var buildMode - "debug" 


可 以 用 以 下 命令 构建 : 


go build -tags-"debug" 
go build -tags-'"windows, debug" 


我 们 可 以 通过 -tags PAITAA A 44 E 7 e buildds is ^ "E112 8170 38 5 2-91 o 


当 有 多 个 build tag 时 ， 我 们 将 多 个 标志 通过 逻辑 操作 的 规则 来 组 合 使 用 。 比 如 以 下 的 构建 标志 
表示 只 有 在 linux/386 或 非 cgo 环 境 的 darwin 平 台 下 才 进 行 构建 。 


// *build linux,386 darwin, !cgo 


其 中 linux,386 中 linux 和 386 用 过 号 链接 表示 AND 的 意思 ; 而 linux,386 和 darwin, cgo 之 间 
通过 空白 分 割 来 表示 OR 的 意思 。 


2.3. 类 型 转换 


最 初 CGO 是 为 了 达到 方便 从 Go 语言 函数 调用 C 语 言 函 数 以 复 用 C 语 言 资源 这 一 目的 而 出 现 的 
(因为 C 语 言 还 会 涉及 回调 函数 ， 自 然 也 会 涉及 到 从 C 语 言 函 数 调用 Go 语言 函数 )。 现 在 ， 它 已 
经 演变 为 C 语 言 和 Go 语言 双向 通讯 的 桥梁 。 要 想 利用 好 CGO 特性 ， 自 然 需要 了 解 此 二 语言 类 
型 之 间 的 转换 规则 ， 这 是 本 节 要 讨论 的 问题 。 


数值 类 型 


在 Go 语言 中 访问 C 语 言 的 符号 时 ， 一 般 是 通过 虚拟 的 “C” 包 访问 ， 比 如 cint 对 应 C 语 言 

的 int 类 型 。 有 些 C 语 言 的 类 型 是 由 多 个 关键 字 组 成 ， 但 通过 虚拟 的 “C”" 包 访问 C 语 言 类 型 时 
名 称 部 分 不 能 空格 字符 ， 比 如 unsigned int 不 能 直接 通过 C.unsigned int 访问 。 因 此 CGO 
为 C 语 言 的 基础 数值 类 型 都 提供 了 相应 转换 规则 ， 比 如 c.uint 对 应 C 语 言 的 unsigned int ° 


Go 语言 中 数值 类 型 和 C 语 言 数据 类 型 基本 上 是 相似 的 ， 以 下 是 它们 的 对 应 关系 表 。 


C 语 言 类 型 CGO 类 型 Go 语言 类 型 
char C.char byte 
singed char C.schar int8 
unsigned char C.uchar uint8 
short C.short int16 
unsigned short C.ushort uint16 
int C int int32 
unsigned int C.uint uint32 
long C.long int32 
unsigned long C.ulong uint32 
long long int C.longlong int64 
unsigned long long int C.ulonglong uint64 
float C float float32 
double C.double float64 
size t C.size t uint 


需要 注意 的 是 ， 虽 然 在 C 语 言 中 int ^ short 等 类 型 没有 明确 定义 内 存 大 小 ， 但 是 在 CGO 中 
它们 的 内 存 大 小 是 确定 的 。 在 CGO 中 ，C 语 言 的 int 和 1ong 类 型 都 是 对 应 4 个 字 节 的 内 存 大 
d^ size t 类 型 可 以 当 作 Go 语言 uint 无 符号 整数 类 型 对 待 。 


CGO 中 ， 虽 然 C 语 言 的 int 国定 为 4 字 节 的 大 小 ， 但 是 Go 语言 自己 的 int 和 uint 却 在 32 位 
和 64 位 系统 下 分 别 对 应 4 个 字 节 和 8 个 字 节 大 小 。 如 果 需 要 在 C 语 言 中 访问 Go 语言 的 int X 
型 ， 可 以 通过 GoInt 类 型 访问 ， Gorint 类 型 在 CGO 工具 生成 的 _cgo_export .h 头 文件 中 定 

义 。 其 实在 _cgo_export.h 头 文件 中 ， 每 个 基本 的 Go 数值 类 型 都 定义 了 对 应 的 C 语 言 类 型 ， 它 
们 一 般 都 是 以 单词 Go 为 前 级 。 下 面 是 64 位 环境 下 ， _cgo_export.h 头 文 件 生成 的 Go 数值 类 型 
的 定义 ， 其 中 GoInt 和 GoUint 类 型 分 别 对 应 GoInt64 和 GoUint64 : 


typedef signed char GoInt8; 
typedef unsigned char GoUint8; 
typedef short GoInt16; 

typedef unsigned short GoUinti16; 
typedef int GoInt32; 

typedef unsigned int GoUint32; 
typedef long long GoInt64; 
typedef unsigned long long GoUint64; 
typedef GoInt64 GoInt; 

typedef GoUint64 GoUint; 

typedef float GoFloat32; 

typedef double GoFloat64; 


除了 GoInt 和 Gouint 之 外 ， 我 们 并 不 推荐 直接 访问 GoInt32 ^ GoInt64 等 类 型 。 更 好 的 做 法 
是 通过 C 语 言 的 C99 标 准 引 入 的 <stdint.h> 头 文件 。 为 了 提高 C 语 言 的 可 移植 性 ， 

在 «stdint.h» 文件 中 ， 不 但 每 个 数值 类 型 都 提供 了 明确 内 存 大 小 ， 而 有 全 和 Go 语言 的 类 型 命名 
更 加 一 致 。 


C 语 言 类 型 CGO 类 型 Go 语言 类 型 

int8 t C.int8 t int8 

uint8 t C.uint8 t uint8 

int16 t C.int16 t int16 

uint16 t C.uint16 t uint16 

int32 t C.int32 t int32 

uint32 t C.uint32 t uint32 

int64 t C.int64 t int64 

uint64 t C.uint64 t uint64 


前 文 说 过 ， 如 果 C 语 言 的 类 型 是 由 多 个 关键 字 组 成 ， 则 无 法 通过 虚拟 的 “C” 包 直接 访问 (比如 C 
语言 的 unsigned short 不 能 直接 通过 C.unsigned short 访问 )。 但 是 ， 在 «stdint.h» 中 通过 
使 用 C 语 言 的 typedef 关键 字 将 unsigned short 重新 定义 为 uinti6 t 这 样 一 个 单词 的 类 型 

后 ， 我 们 就 可 以 通过 c.uintie t 访问 原来 的 unsigned short 类 型 了 。 对 于 比较 复杂 的 C 语 言 


类 型 ， 推 荐 使 用 typedef 关键 字 提 供 一 个 规则 的 类 型 命名 ， 这 样 更 利于 在 CGO 中 访问 。 


Go Fi PPh h 


在 CGO 生成 的 cgo export.h 头 文 件 中 还 会 为 Go 语言 的 字符 串 、 切 片 、 字 典 、 接 口 和 管道 等 
特有 的 数据 类 型 生成 对 应 的 C 语 言 类 型 : 


typedef struct { const char *p; GoInt n; } GoString; 

typedef void *GoMap; 

typedef void *GoChan; 

typedef struct ( void *t; void *v; } GoInterface; 

typedef struct ( void *data; GoInt len; GoInt cap; ) GoSlice; 


不 过 需要 注意 的 是 ， 其 中 只 有 字符 囊 和 切片 在 CGO 中 有 一 定 的 使 用 价值 ， 因 为 此 二 者 可 以 在 
Go 调用 C 语 言 函 数 时 马上 使 用 ;而 CGO 并 未 针对 其 他 的 类 型 提供 相关 的 辅助 函数 ， 且 Go 语言 
特有 的 内 存 模型 导致 我 们 无 法 保持 这 些 由 Go 语言 管理 的 内 存 指针 ， 所 以 它们 C 语 言 环境 并 无 
使 用 的 价值 。 


在 导出 的 C 语 言 函 数 中 我 们 可 以 直接 使 用 Go 字符 事 和 切片 。 假 设 有 以 下 两 个 导出 函数 : 


//export helloString 
func helloString(s string) {} 


//export helloSlice 


func helloSlice(s []byte) {} 


CGO 生成 的 cgo export.h 头 文 件 会 包含 以 下 的 函数 声明 : 


extern void helloString(GoString po); 
extern void helloSlice(GoSlice p0); 


不 过 需要 注意 的 是 ， 如 果 使 用 了 GoString 类 型 则 会 对 cgo export. h 头 文件 产生 依赖 ， 而 这 个 
头 文件 是 动态 输出 的 。 


Go1.10 针 对 Go 字符 串 增 加 了 一 个 _Gostring_ 预定 义 类 型 ， 可 以 降低 在 cgo 代 码 中 可 能 
对 cgo export.h 头 文件 产生 的 循环 依赖 的 风险 。 我 们 可 以 调整 helloString 有 函数 的 C 语 言 声 明 
为 : 


extern void helloString( GoString  p0); 


因为 Gostring 是 预定 义 类 型 ， 我 们 无 法 通过 此 类 型 直接 访问 字符 串 的 长 度 和 指针 等 信息 。 
Go1.10 同 时 也 增加 了 以 下 两 个 函数 用 于 获取 字符 串 结 构 中 的 长 度 和 指针 信息 : 


size t GoStringLen( GoString s); 
const char * GoStringPtr( GoString s); 


更 严谨 的 做 法 是 为 C 语 言 函 数 接口 定义 严格 的 头 文件 ， 然 后 基于 稳定 的 头 文件 实现 代码 。 


结构 体 、 联 合 、 枚 举 类 型 


C 语 言 的 结构 体 、 联 合 、 枚 举 类 型 不 能 作为 匿名 成 员 被 齿 入 到 Go 语言 的 结构 体 中 。 在 Go 语言 
中 ， 我 们 可 以 通过 c.struct_xxx 来 访问 C 语 言 中 定义 的 struct xxx 结构 体 类 型 。 结 构 体 的 内 
存 布 局 按照 C 语 言 的 通用 对 齐 规则 ， 在 32 位 Go 语言 环境 C 语 言 结构 体 也 按照 32 位 对 齐 规则 ， 
在 64 位 Go 语言 环境 按照 64 位 的 对 齐 规则 。 对 于 指定 了 特殊 对 齐 规则 的 结构 体 ， 无 法 在 CGO 中 
访问 。 


结构 体 的 简单 用 法 如 下 : 


/* 

struct A ( 
ainue abs 
float f; 

}; 

x / 

mmporste cs 

import "fmt" 


func main() { 
var a C.struct A 
fmt.Println(a.i) 
fmt.Println(a.f) 


如 果 结 构 体 的 成 员 名 字 中 碰巧 是 Go 语言 的 关键 字 ， 可 以 通过 在 成 员 名 开头 添加 下 划 线 来 访 
问 : 


7 
struct A { 
int type; // type 是 Go 语言 的 关键 字 
um 
fot 
+y 
mo te cs 


import "fmt" 


func main() { 
var a C.struct A 


+ 


fmt.Println(a. type) // type 对 应 type 


但 是 如 果 有 2 个 成 员 : 一 个 是 以 Go 语言 关键 字 命名 ， 另 一 个 刚好 是 以 下 划 线 和 Go 语言 关键 字 
命名 ， 那 么 以 Go 语言 关键 字 命 名 的 成 员 将 无 法 访问 (被 屏蔽 ) 





/* 
struct A ( 
int type; // type € Go 语言 的 关键 字 
float type; // 将 屏蔽 CGO 对 type 成 员 的 访问 
yo 
y 
import "C" 


import "fmt" 


func main() { 
var a C.struct A 
fmt.Println(a. type) // type 对 应 type 


C 语 言 结构 体 中 位 字段 对 应 的 成 员 无 法 在 Go 语言 中 访问 ， 如 果 需 要 操作 位 字段 成 员 ， 需 要 通 
过 在 C 语 言 中 定义 辅助 函数 来 完成 。 对 应 零 长 数组 的 成 员 ， 无 法 在 Go 语言 中 直接 访问 数组 的 
元 素 ， 但 其 中 零 长 的 数组 成 员 所 在 位 置 的 偏 移 量 依然 可 以 通过 unsafe.offsetof(a.arr) 来 访 
问 。 


/* 
struct A ( 
int size: 10; // 位 字段 无 法 访问 
float arr[]; // 零 长 的 数组 也 无 法 访问 
H 
7 
import “es 


import "fmt" 


func main() { 
var a C.struct A 
fmt.Println(a.size) // 错误 : 
fmt.Println(a.arr) // $33: 





在 C 语 言 中 ， 我 们 无 法 直接 访问 Go 语言 定义 的 结构 体 类 型 。 


对 于 联合 类 型 ， 我 们 可 以 通过 c.union_xxx 来 访问 C 语 言 中 定义 的 union xxx 类 型 。 但 是 Go 语 
言 中 并 不 支持 C 语 言 联 合 类 型 ， 它 们 会 被 转 为 对 应 大 小 的 字 节 数组 。 


Js 
include «stdint.h» 


union B1 { 
aum 26e 
iel'oat Rs 
J; 


union B2 ( 


a abs 
int64 t i64; 
H 
2s 
zm Ote C 


Import time 


func main() { 
var b1 C.union_B1; 
fmt.Printf("%T\n", b1) // [4]uint8 


var b2 C.union B2; 
fmt.Printf("%T\n", b2) // [8]uint8 


如 果 需 要 操作 C 语 言 的 联合 类 型 变量 ， 一 般 有 三 种 方法 : 第 一 种 是 在 C 语 言 中 定义 辅助 函数 ; 
第 二 种 是 通过 Go 语言 的 "encoding/binary" 手 工 解码 成 员 (需要 注意 大 端 小 端 问题 ) ; 第 三 种 是 使 
用 unsafe 包 强 制 转型 为 对 应 类 型 (这 是 性 能 最 好 的 方式 ) 。 下 面 展 示 通 过 unsafe 包 访 问 联合 类 
型 成 员 的 方式 : 


Fe 
include «stdint.h» 


union BEL 
alijs. ab» 
float f; 

Sy 

import "C" 

import "fmt" 


func main() { 
var b C.union B; 
fmt.Println("b.i:", *(*C.int)(unsafe.Pointer(&b))) 
fmt.Println("b.f:", *(*C.float)(unsafe.Pointer(&b))) 


虽然 unsafe EG RAŽ ELR ETARAKO ŽAGAR RA RAA 
杂 化 。 对 于 复杂 的 联合 类 型 ， 推 荐 通过 在 C 语 言 中 定义 辅助 函数 的 方式 处 理 。 


对 于 枚 举 类 型 ， 我 们 可 以 通过 c.enum xxx 来 访问 C 语 言 中 定义 的 enum xxx 结构 体 类 型 。 


/* 

enum C { 
ONE, 
TWO, 

) 

x, 

import "C" 


import "fmt" 


func main() { 
var c C.enum C - C.TWO 
fmt.Println(c) 
fmt.Println(C.ONE) 
fmt.Println(C.TWO) 


在 C 语 言 中 ， 枚 举 类 型 底层 对 应 int 类 型 ， 支 持 负 数 类 型 的 值 。 我 们 可 以 通 
过 c.oNE ^ c.Two 等 直接 访问 定义 的 枚 举 值 。 


数组 、 字 符 串 和 切片 


在 C 语 言 中 ， 数 组 名 其 实 对 应 于 一 个 指针 ， 指 向 特定 类 型 特定 长 度 的 一 段 内 存 ， 但 是 这 个 指针 
不 能 被 修改 ; 当 把 数组 名 传递 给 一 个 函数 时 ， 实 际 上 传递 的 是 数组 第 一 个 元 素 的 地 址 。 为 了 
讨论 方便 ， 我 们 将 一 段 特 定 长 度 的 内 存 统称 为 数组 。C 语 言 的 字符 串 是 一 个 char 类 型 的 数组 ， 
字符 串 的 长 度 需 要 根据 表示 结尾 的 NULL 字 符 的 位 置 确定 。C 语 言 中 没有 切片 类 型 。 


在 Go 语言 中 ， 数 组 是 一 种 值 类 型 ， 而 且 数 组 的 长 度 是 数组 类 型 的 一 个 部 分 。Go 语 言 字符 串 对 
应 一 段 长 度 确 定 的 只 读 byte 类 型 的 内 存 。Go 语 言 的 切片 则 是 一 个 简化 版 的 动态 数组 。 


Go 语言 和 C 语 言 的 数组 、 字 符 串 和 切片 之 间 的 相互 转换 可 以 简化 为 Go 语言 的 切片 和 C 语 言 中 
指向 一 定 长 度 内 存 的 指针 之 间 的 转换 。 


CGO 的 C 虚 拟 包 提供 了 以 下 一 组 函数 ， 用 于 Go 语言 和 C 语 言 之 间 数 组 和 字符 串 的 双向 转换 : 


/Go String CO sening 

// The C string is allocated in the C heap using malloc. 

// It is the caller's responsibility to arrange for it to be 

// freed, such as by calling C.free (be sure to include stdlib.h 
// if C.free is needed). 

func C.CString(string) *C.char 


// Go []byte slice to C array 

// The C array is allocated in the C heap using malloc. 

// It is the caller's responsibility to arrange for it to be 

// freed, such as by calling C.free (be sure to include stdlib.h 
// if C.free is needed). 

func C.CBytes([]byte) unsafe.Pointer 


// C string to Go string 
func C.GoString(*C.char) string 


// C data with explicit length to Go string 
func C.GoStringN(*C.char, C.int) string 


// C data with explicit length to Go []byte 
func C.GoBytes(unsafe.Pointer, C.int) []byte 


其 中 c.cstring 针对 输入 的 Go 字符 串 ， 克 隆 一 个 C 语 言 格式 的 字符 串 ; 返回 的 字符 串 由 C 语 言 
的 malloc 函数 分 配 ， 不 使 用 时 需要 通过 C 语 言 的 free 函数 释放 。 c.cBytes 函数 的 功能 

fe c.cstring 类 似 ， 用 于 从 输入 的 Go 语言 字 节 切 片 克 隆 一 个 C 语 言 版 本 的 字 节 数组 ， 同 样 返 
回 的 数组 需要 在 合适 的 时 候 释 放 。 c.Gostring 用 于 将 从 NULL 结 尾 的 C 语 言 字 符 串 克隆 一 个 
Go 语言 字符 串 。 c.GostringN 是 另 一 个 字符 数组 克隆 函数 。 cC,GoBytes 用 于 从 C 语 言 数组 ， 克 
隆 一 个 Go 语言 字 节 切片 。 


该 组 辅助 函数 都 是 以 克隆 的 方式 运行 。 当 Go 语言 字符 串 和 切片 向 C 语 言 转 换 时 ， 克 隆 的 内 存 
由 C 语 言 的 malloc 函数 分 配 ， 最 终 可 以 通过 free 函数 释放 。 当 C 语 言 字 符 串 或 数组 向 Go 语 
言 转换 时 ， 克 隆 的 内 存 由 Go 语言 分 配 管理 。 通 过 该 组 转换 函数 ， 转 换 前 和 转换 后 的 内 存 依然 
在 各 自 的 语言 环境 中 ， 它 们 并 没有 跨越 Go 语言 和 C 语 言 。 克 隆 方式 实现 转换 的 优点 是 接口 和 
内 存 管理 都 很 简单 ， 缺 点 是 克隆 需要 分 配 新 的 内 存 和 复制 操作 都 会 导致 额外 的 开销 。 


在 reflect. 包 中 有 字符 串 和 切片 的 定义 : 


type StringHeader struct { 
Data uintptr 
Len int 


type SliceHeader struct { 
Data uintptr 
Len int 
Cap int 


如 果 不 希 望 单独 分 配 内 存 ， 可 以 在 Go 语言 中 直接 访问 C 语 言 的 内 存 空间 : 


static char arr[10]; 
static char *s - "Hello"; 
* 

ampormte c 


import "fmt" 


func main() { 
// 通过 reflect.SliceHeader 转换 
var arro []byte 
var arrOHdr = (*reflect.SliceHeader)(unsafe.Pointer(&arr0)) 
arrOHdr.Data = uintptr(unsafe.Pointer(&C.arr[0])) 
10 
10 


arrOHdr.Len 


arrOHdr.Cap 


// 通过 切片 语法 转换 


arri := (*[31]byte)(unsafe.Pointer(&C.arr[0]))[:10:10] 


var sO string 

var sOHdr := (*reflect.StringHeader)(unsafe.Pointer(&sO)) 
seHdr.Data = uintptr(unsafe.Pointer(C.s)) 

soHdr.Len = int(C.strlen(C.s)) 


sLen :- int(C.strlen(C.s)) 
S1 := string((*[31]byte)(unsafe.Pointer(&C.s[0])) [:sLen:sLen]) 


因为 Go 语言 的 字符 串 是 只 读 的 ， 用 户 需要 自己 保证 Go 字符 串 在 使 用 期 间 ， 底 层 对 应 的 C 字 符 
串 内 容 不 会 发 生变 化 、 内 存 不 会 被 提前 释放 掉 。 


在 CGO 中 ， 会 为 字符 串 和 切片 生成 和 上 面 结构 对 应 的 C 语 言 版 本 的 结构 体 : 


typedef struct { const char *p; GoInt n; } GoString; 
typedef struct { void *data; GoInt len; GoInt cap; ) GoSlice; 


在 C 语 言 中 可 以 通过 GoString 和 coSlice 来 访 问 Go 语 言 的 字符 串 和 切片 9 如 果 是 Go 语言 中 数 
组 类 型 ， 可 以 将 数组 转 为 切片 后 再 行 转换 。 如 果 字 符 串 或 切片 对 应 的 底层 内 存 空间 由 Go 语言 
的 运行 时 管理 ， 那 么 在 C 语 言 中 不 能 长 时 间 保 存 Go 内 存 对 象 。 


关于 CGO 内 存 模 型 的 细节 在 稍 后 章节 中 会 详细 讨论 。 


指针 间 的 转换 


在 C 语 言 中 ， 不 同类 型 的 指针 是 可 以 显 式 或 隐 式 转换 的 ， 如 果 是 隐 式 只 是 会 在 编译 时 给 出 一 些 
警告 信息 。 但 是 Go 语言 对 于 不 同类 型 的 转换 非常 严格 ， 任 何 C 语 言 中 可 能 出 现 的 警告 信息 在 
Go 语言 中 都 可 能 是 错误 ! 指针 是 C 语 言 的 灵魂 ， 指 针 间 的 自由 转换 也 是 cgo 代 码 中 经 常 要 解决 
的 第 一 个 重要 的 问题 。 


在 Go 语言 中 两 个 指针 的 类 型 完全 一 致 则 不 需要 转换 可 以 直接 通用 。 如 果 一 个 指针 类 型 是 用 
type 命 令 在 另 一 个 指针 类 型 基础 之 上 构建 的 ， 换 言 之 两 个 指针 底层 是 相同 完全 结构 的 指针 ， 那 
么 我 我 们 可 以 通过 直接 强制 转换 语法 进行 指针 间 的 转换 。 但 是 cgo 经 常 要 面 对 的 是 2 个 完全 不 
同类 型 的 指针 间 的 转换 ， 原 则 上 这 种 操作 在 纯 Go 语 言 代 码 是 严格 禁止 的 。 


o 
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以 下 代码 演示 了 如 何 将 X 类 型 的 指针 转化 为 Y 类 型 的 指针 : 


var p *X 
var q *Y 


(*Y)(unsafe.Pointer(p)) // *X -» *Y 
(*X)(unsafe.Pointer(q)) // *Y => *X 


q 
p 


为 了 实现 X 类 型 指针 到 Y 类 型 指针 的 转换 ， 我 们 需要 借助 unsafe.Pointer 作为 中 间 桥 接 类 型 实 
现 不 同类 型 指针 之 间 的 转换 。 unsafe.Pointer 指针 类 型 类 似 C 语 言 中 的 void* 类 型 的 指针 o 


下 面 是 指针 间 的 转换 流程 的 示意 图 : 


*X <=> *Y 


unsafe.Pointer 
j 1 
1 1 

1 

aaa r aaa 


1 1 
1*Xto unsafe.Pointer 





1 

1 

1 

1 

1 

1 

1 

1 1 1 
| unsafe.Pointer to *Y L! 
I —MM——————- 

1 1 
1 1 
1 1 
1 

1 

! 

1 

1 

1 

1 


= a M 


I 
*Y to unsafe.Pointer 


1 
1 
1 
1 
! unsafe.Pointer to *X 
1 


任何 类 型 的 指针 都 可 以 通过 强制 转换 为 unsafe.Pointer 指针 类 型 去 掉 原 有 的 类 
再 重新 赋予 新 的 指针 类 型 而 达到 指针 间 的 转换 的 目的 。 


ay 
2 (m 
a 


数值 和 指针 的 转换 


不 同类 型 指针 间 的 转换 看 似 复杂 ， 但 是 在 cgo 中 已 经 算是 比较 简单 的 了 。 在 C 语 言 中 经 常 遇 到 
用 普通 数值 表示 指针 的 场景 ， 也 就 是 说 如 何 实现 数值 和 指针 的 转换 也 是 cgo 需 要 面 对 的 一 个 问 
题 o 


为 了 严格 控制 指针 的 使 用 ，Go 语 言 禁止 将 数值 类 型 直接 转 为 指针 类 型 | 不 过 ，Go 语 言 针 

对 unsafe.Pointr 指针 类 型 特别 定义 了 一 个 uintptr 类 型 。 我 们 可 以 uintptr 为 中 介 ， 实 现 数值 类 
型 到 unsafe.Pointr 指针 类 型 到 转换 。 再 结合 前 面 提 到 的 方法 ， 就 可 以 实现 数值 和 指针 的 转换 
了 o 


下 面 流程 图 演示 了 如 何 实现 int32 类 型 到 C 语 言 的 char* 字符 串 指针 类 型 的 相互 转换 : 


int32 <=> *C.char 
1 1 1 1 
1 1 


1 
1 1 
! int32 to Uintptr ' 
> 

1 

1 





1 1 
! uintptr to unsafe.Pointer 
1 


1 

|. "C.char to unsafe.Pointer | 
乓 -一 一 一 一 一 一 一 一 
1 l 
1 





uintptr to int32 | i 
1 


1 1 


转换 分 为 几 个 阶段 ， 在 每 个 阶段 实现 一 个 小 目标 : 首先 是 int32 到 uintptr 类 型 ， 然 后 是 uintptr 


到 unsafe.Pointr 指针 类 型 ， 最 后 是 unsafe.Pointr 指针 类 型 到 *c.char 类 型 。 


切片 间 的 转换 


在 C 语 言 中 数组 也 一 种 指针 ， 因 此 两 个 不 同类 型 数组 之 间 到 转换 和 指针 间 转 换 基 本 类 似 。 但 是 
在 Go 语言 中 ， 数 组 或 数组 对 应 到 切片 都 不 再 是 指针 类 型 ， 因 为 我 们 也 就 无 法 直接 实现 不 同类 
型 到 切片 之 间 的 转换 。 


不 过 Go 语言 的 reflect 包 提供 了 切片 类 型 到 底层 结构 ， 再 结合 前 面 讨论 到 不 同类 型 之 间 到 指针 
转换 技术 就 可 以 实现 px fe pv 类 型 的 切片 转换 : 


var p []X 
var q []Y 


pHdr :- (*reflect.SliceHeader)(unsafe.Pointer(&p)) 
qHdr := (*reflect.SliceHeader)(unsafe.Pointer(&q)) 


pHdr.Data = gHdr.Data 
pHdr.Len = gHdr.Len * unsafe.Sizeof(q[90]) / unsafe.Sizeof(p[9]) 
pHdr.Cap = qHdr.Cap * unsafe.Sizeof(q[90]) / unsafe.Sizeof(p[9]) 
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充 目标 切片 。 如 果 X 和 Y 类 型 的 大 小 不 同 ， Du d 性 。 


需要 注意 的 是 ， 如 果 


X 或 Y 是 空 类 型 ， 上 述 代 码 中 可 能 导致 除 0 错误 ， 实 际 代码 需要 根据 情况 酌情 处 理 。 


下 面 演示 了 切片 间 的 转换 的 具体 流程 : 


[IX <=> [IY 


var x []X 


var px *SliceHeader 


var py *SliceHeader 





1 
一 [IX and []Y to *reflectSliceHeader 


(*reflect.SliceHeaderXunsafe.Pointer(&x)) 
(*reflect.SliceHeaderXunsafe.Pointer(&y)) 


1 
— — copy *px to *py —— 一 一 








-——-JH------- 


PE 
ll 
x 


1 
1 
=H y changed by *py = 
1 
1 
1 
1 
1 


l 


var x []X var px *SliceHeader 


var y []Y var py *SliceHeader 





针对 CGO 中 常用 的 功能 ， 作 者 封装 了 "github.com/chai2010/cgo" & > 4&£ 
具体 的 细节 可 以 参考 实现 代码 。 


共 基 本 的 转换 功能 ， 


2.4. :& Zi 1 JR] 


函数 是 C 语 言 编程 的 核心 ， 通 过 CGO 技术 我 们 不 仅仅 可 以 在 Go 语言 中 调用 C 语 言 函 数 ， 也 可 
以 将 Go 语言 函数 导出 为 C 语 言 函 数 。 


Go f] C $ žr 


对 于 一 个 启用 CGO 特 性 的 程序 ，CGO 会 构造 一 个 虚拟 的 C 包 。 通 过 这 个 虚拟 的 C 包 可 以 调用 C 


语言 函数 。 


import "C" 
func main() { 


C.add(1i, 1) 
} 


以 上 的 CGO 代码 首先 定义 了 一 个 当前 文件 内 可 见 的 add 函 数 ， 然 后 通过 cadd 。 
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对 于 有 返回 值 的 C 函 数 ， 我 们 可 以 正常 获取 返回 值 。 


amporstes c 
import "fmt" 


func main() { 


v := C.div(6, 3) 
fmt.Println(v) 


上 面 的 div 函 数 实现 了 一 个 整数 除法 的 运算 ， 然 后 通过 返回 值 返回 除法 的 结果 o 


不 过 对 于 除数 为 0 的 情形 并 没有 做 特殊 处 理 。 如 果 希 望 在 


除数 为 0 的 diei vi ， 其 他 


时 候 返回 正常 的 结果 。 因 为 C 语 言 不 支持 返回 多 个 结果 ， 因 此 <errno.h> 标准 库 提供 
个 errno 宏 用 于 返回 错误 状态 。 我 们 可 以 近似 地 将 errno 看 成 一 个 线程 安 AR ， 可 


以 用 于 记录 最 近 一 次 错误 的 状态 码 。 
E f) divi Zi S: Sud: 


include «errno.h» 


int div(int a, int b) ( 


if(b == 0) { 
errno - EINVAL; 
return 0; 

} 


return a/b; 


CGO 也 针对 <errno.h> 标准 库 的 errno 宏 做 的 特殊 支持 : 
回 值 ， 那 么 第 二 个 返回 值 将 对 应 errno 错误 状态 。 


ES 
4include «errno.h» 


skalkbnc ente dv (ne mec 


if(b -- 90) 1 
errno = EINVAL; 
return 0; 


1 
4 


return a/b; 


1 
了 


2 
import "C" 
import "fmt" 


func main() { 
vO, errO := C.div(2, 1) 


fmt.Println(vO, err0) 


v1, erri := C.div(1, 0) 


fmt.Println(vi, erri) 


运行 这 个 代码 将 会 产生 以 下 输出 : 


2 «nil» 
9 invalid argument 


4& CGO?R M C :& ZI] de RA A IR 


我 们 可 以 近似 地 将 div 函 数 看 作为 以 下 类 型 的 函数 : 
func C.div(a, b C.int) (C.int, [error]) 


A 


第 二 个 返回 值 是 可 忽略 的 error 接 口 类 型 ， 底 层 对 应 syscall.Errno 错误 类 型 。 


void £j žr &^ 3& te] 4à 


C 语 言 函 数 还 有 一 种 没有 返回 值 类 型 的 函数 ， 用 void 表 示 返 回 值 类 型 。 一 般 情 况 下 ， 我 们 无 法 
ls a a T SU A ne na 
特殊 处 理 ， 可 以 通过 第 二 个 返回 值 来 获取 C 语 言 的 错误 状态 。 对 于 void 类 型 函数 ， 这 个 特性 依 


以 下 的 代码 是 获取 没有 返回 值 函数 的 错误 状态 码 : 


//static void noreturn() {} 
Import ee 
import "fmt" 


func main() { 


_ err := C.noreturn() 
fmt.Println(err) 
} 
此 时 ， 我 们 忽略 了 第 一 个 返回 值 ， 只 获取 第 二 个 返回 值 对 应 的 错误 码 。 


我 们 也 可 以 尝试 获取 第 一 个 返回 值 ， 它 对 应 的 是 C 语 言 的 void 对 应 的 Go 语言 类 型 : 


//static void noreturn() 1) 
import "C" 
import "fmt" 


func main() { 
V, .. := C.noreturn() 
fmt.Printf("%#v", v) 


运行 这 个 代码 将 会 产生 以 下 输出 : 


main. Ctype void() 


我 们 可 以 看 出 C 语 言 的 void 类 型 对 应 的 是 当前 的 main 包 中 的 ctype void 类 型 。 其 实 也 将 C 语 
Z fünoreturn à ZU TEE 3& I ctype void 类 型 的 函数 ， 这 样 就 可 以 直接 获取 void 类 型 函数 的 
返回 值 : 


//static void noreturn() {} 
Import er 
import "fmt" 


func main() { 
fmt.Println(C.noreturn()) 


} 
运行 这 个 代码 将 会 产生 以 下 输出 : 
[] 
其 实在 CGO 生 成 的 代码 中 ， ctype void 类 型 对 应 一 个 0 长 的 数组 类 型 [ol]byte ， 


此 fmt.Println 输出 的 是 一 个 表示 空 数值 的 方 括 缴 。 


以 上 有 效 特 性 虽然 看 似 有 些 无 聊 ， 但 是 通过 这 些 例子 我 们 可 以 精确 掌握 CGO 代码 的 边界 ， 可 
以 从 更 深层 次 的 设计 的 角度 来 思考 产生 这 些 奇 怪 特性 的 原因 。 


C 调 用 Go 导出 函数 


CGO 还 有 一 个 强大 的 特性 : 将 Go 元 数 导出 为 C 语 言 函 数 。 这 样 的 话 我 们 可 以 定义 好 C 语 言 接 
口 ， 然 后 通过 Go 语言 实现 。 在 本 章 的 第 一 节 快 速 入 门 部 分 我 们 已 经 展示 过 Go 语言 导出 C 语 言 
函数 的 例子 。 


下 面 是 用 Go 语言 重新 实现 本 节 开 始 的 add 函 数 : 


Import nei 


//export add 
func add(a, b C.int) C.int { 
return atb 


} 


add 函 数 名 以 小 写字 母 开 头 ， 对 于 Go 语言 来 说 是 包 内 的 私有 函数 。 但 是 从 C 语 言 角度 来 看 ， 导 
出 的 add 函 数 是 一 个 可 全 局 访问 的 C 语 言 函 数 。 如 果 在 两 个 不 同 的 Go 语言 包 内 ， 都 存在 一 个 同 
名 的 要 导出 为 C 语 言 函 数 的 add 函 数 ， 那 么 在 最 终 的 链接 阶段 将 会 出 现 符号 重 名 的 问题 。 


CGO 生成 的 cgo export.h 文件 回 包 含 导出 后 的 C 语 言 函 数 的 声明 。 我 们 可 以 在 纯 C 源 文件 

中 包含 cgo export.h 文件 来 引用 导出 的 add 有 函数 。 如 果 和 希望 在 当前 的 CGO 文件 中 马上 使 用 

导出 的 C 语 言 add 有 函数 ， 则 无 法 引用 cgo export.h 文件 。 因 为 cgo export.h. 文件 的 生成 需 
要 依赖 当前 文件 可 以 正常 构建 ， 而 如 果 当 前 文件 内 部 循环 依赖 还 未 生成 的 _cgo_export.h 文 

件 将 会 导致 cgo 命 令 错误 。 


4include " cgo export.h" 
void foo() { 


add(i, 1); 
} 


当 导 出 C 语 言 接口 时 ， 需 要 保证 函数 的 参数 和 返回 值 类 型 都 是 C 语 言 友好 的 类 型 ， 同 时 返回 值 
不 得 直接 或 间接 包含 Go 语言 内 存 空间 的 指针 。 


2.5. 内 部 机 制 


对 于 刚刚 接触 CGO 用 户 来 说 ，CGO 的 很 多 特性 类 似 魔 法 。CGO 特 性 主要 是 通过 一 个 叫 cgo 的 
命令 行 工 具 来 辅助 输出 Go 和 C 之 间 的 桥接 代码 。 本 节 我 们 尝试 从 生成 的 代码 分 析 Go 语 言 和 C 
语言 函数 直接 相互 调用 的 流程 。 


CGO 生 成 的 中 间 文 件 


要 了 解 CGO 技 术 的 底层 秘密 首先 需要 了 解 CGO 生 成 了 哪些 中 间 文 件 。 我 们 可 以 在 构建 一 个 
cgo 包 时 增加 一 个 -work 输出 中 间 生 成 文件 所 在 的 目录 并 且 在 构建 完成 时 保留 中 间 文 件 。 如 果 
是 比较 简单 的 cgo 代 码 我 们 也 可 以 直接 通过 手工 调用 go tool cgo 命令 来 查看 生成 的 中 间 文 
件 。 


在 一 个 Go 源 文件 中 ， 如 果 出 现 了 import "c" 指令 则 表示 将 调用 cgo 命 令 生成 对 应 的 中 间 文 
件 。 下 图 是 cgo 生 成 的 中 间 文 件 的 简单 示意 图 : 


package main 


nocgo l.go nocgo x.go 





包 中 有 4 个 Go 文件 ， 其 中 nocgo 开 头 的 文件 中 没有 import "c" 指令 ， 其 它 的 2 个 文件 则 包含 了 
cg0 代 码 。cgo 命 令 会 为 每 个 包含 了 cgo 代 码 的 Go 文件 创建 2 个 中 间 文 件 ， 比 如 main.go 会 分 别 
创建 main.cgo1.go 和 main.cgo2.c 两 个 中 间 文 件 。 然 后 会 为 整个 包 创 建 一 个 

_cgo_gotypes.go Go 文件 ， 其 中 包含 Go 语言 部 分 辅助 代码 。 此 外 还 会 创建 一 个 
_cgo_export.h 和 cgo export.c 文件 ， 对 应 Go 语言 导出 到 C 语 言 的 类 型 和 元 数 。 


Go" f] C $% 


Go78 Jl] C £& 2 t C GO dic E LERAAR o ALLE c f PEU PL EC. 2- EGO? FL C S C8 iE 


细 流 程 。 


具体 代码 如 下 (main.go) 


package main 


//int sum(int a, int b) ( return a-*b; j 
import "C" 


func main() { 
println(C.sum(1, 1)) 


首先 构建 并 运行 该 例子 没有 错误 。 然 后 通过 cgo 命 令 行 工 具 在 _obj 目 录 生 成 中 间 文 件 : 


$ go tool cgo main.go 


查看 _obj 目 录 生 成 中 间 文 件 : 


$ ls obj | awk '(print $NF} 
.Cgo .O 

.cgo export.c 

.cgo export.h 

.cgo flags 

.cgo gotypes.go 

.cgo main.c 

main.cgo1.go 

main.cgo2.c 


其 中 cgo .o ^ cgo flags 和 cgo main.c 文件 和 我 们 的 代码 没有 直接 的 逻辑 关联 ， 可 以 暂 
时 忽略 。 





我 们 先 查 看 main.cgol.go 文件 ， 它 是 main.go 文 件 展开 虚拟 C 包 相关 函数 和 变量 后 的 Go 代码 : 


package main 


//int sum(int a, int b) ( return a-*b; ) 
import _ "unsafe" 
func main() { 

printin(( Cfunc sum)(i, 1)) 


其 中 C.sum(1, 1) Fr 函数 调用 被 蔡 换 成 了 (.Cfunc sum)(1, 1) ° 每 一 个 C.XXX 形式 的 函数 都 会 
被 替换 为 cfunc xxx 格式 的 纯 GoO 函 数 ， 其 中 前 级 cfunc 表示 这 是 一 个 C 函 数 ， 对 应 一 个 私 
有 的 Go 桥 dE E o 


.Cfunc sum 函数 在 cgo 生 成 的 .cgo gotypes.go 文件 中 定义 : 


//go:cgo unsafe args 
func  Cfunc sum(pO dCtype int, p1 Ctype int) (r1 Ctype int) { 
.cgo runtime cgocall( cgo 506f45f9fa85 Cfunc sum, uintptr(unsafe.Pointer(&pO))) 
if  Cgo always false { 
.Cgo use(p0) 
.Cgo use(p1) 
} 


return 


 Cfunc sum EZ hg A Xi feik uM .Ctype int 类 型 对 应 c.int 类 型 ， 命 名 的 规则 
和 cfunc xxx 类 似 ， 不 同 的 前 组 用 于 区 分 函数 和 类 型 。 


其 中 .cgo runtime cgocall 对 应 runtime.cgocall 函数 ， 了 有 函数 的 声明 如 下 : 


func runtime.cgocall(fn, arg unsafe.Pointer) int32 


第 一 个 参数 是 C 语 言 函 数 的 地 址 ， 第 二 个 参数 是 存放 C 语 言 函 数 对 应 的 参数 结构 体 的 地 址 。 


在 这 个 例子 中 ， 被 传 入 C 语 言 函 数 cgo soefasfo9fas5 Cfunc sum 也 是 cgo 生 成 的 中 fa] £j o $ 
数 在 main.cgo2.c 定义 : 


void _cgo_506f45f9fa85_Cfunc_sum(void *v) { 

struct { 

int pO; 

int pi; 

aliqno TER 

char | padi2[4]; 
) attribute (( packed )) *a-v 
char *stktop = cgo topofstack(); 





. typeof (a-»r) r; 

.cgo tsan acquire(); 

r = sum(a-»p0, a-»p1); 

.cgo tsan release(); 

a = (void*)((char*)a + (cgo topofstack() - stktop)); 
a->r = r; 


这 个 函数 参数 只 有 一 个 void 范 型 的 指针 ， 函 数 没有 返 o i S: f9sumr Z8 d XA Ue 
值 均 通过 唯一 的 参数 指针 类 实现 。 


cgo 506f45f9fa85 Cfunc sum EAE 4944 4T 48 1 02 2533 73 : 


struct 1 
int pO; 
int p1; 
aique dep 
char | padi2[4]; 
) attribute ((. packed )) *a = 





其 中 p0 成 员 对 应 sum 的 第 一 个 参数 ，p1 成 员 对 应 sum 的 第 二 个 参数 ，r 成 员 ， padi2 M P 
充 结构 体 保 证 对 齐 CPU 机 器 字 的 整 倍数 。 


后 从 参数 指向 的 结构 体 获取 调用 参数 后 开始 调用 牙 实 的 C 语 言 版 Sum 函数， 并 且 将 返回 值 保 
持 到 结构 体内 返回 值 对 应 的 成 员 。 


为 Go 语言 和 C 语 言 有 着 不 同 的 内 存 模型 和 函数 调用 规范 。 其 中 _cgo_topofstack d Z8 X 
488 JE] T C Es CR] E] Js D LIB ° cgo tsan acquire 和 .cgo tsan release 则 是 用 于 扫描 
CGO 相 关 的 元 数 则 是 对 CGO 相 关 郊 数 的 指针 做 相关 检查 。 


c.sum 的 整个 调用 流程 图 如 下 : 


C.sum(2, 3) 


main.cgo1.go .cgo types.go runtime.cgocall main.cgo2.c -cgo export.c 













func main ( 
C.sum(2, 3) 


func maino { 
-Cfunc sumQ, 3)) 


func .Cfunc.sum(2, 3) double ( 
-cgo. runtime. cgocall(...) 
return 


-cgo. runtime. cgocall(...) 








double .cgo. xxx. Cfunc. sum(2, 3) { 
return sum(2, 3) 

) 

E sum(2, 3) 


-cgo.runtime. cgocall(...) 


其 中 runtime.cgocali 元 数 是 实现 GO 语言 到 C 语 言 函 数 跨 界 调用 的 关键 。 更 详细 的 细节 可 以 参 
考 https://golang.org/src/cmd/cgo/doc.go 内 部 的 代码 注释 和 runtime.cgocall 函数 的 实现 。 
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在 简单 分 析 了 Go 调用 C 函 数 的 流程 后 ， 我 们 现在 来 分 析 C 反 向 调用 Go 函数 的 流程 。 同 样 ， 我 
们 现 构造 一 个 Go 语言 版 本 的 sum 函数 ， 文 件 名 同样 为 main.go : 


package main 


//int sum(int a, int b); 
import "c" 


//export sum 
func sum(a, b C.int) C.int { 
return a * b 


} 


func main() {} 


CGO Am RER o A TECER TdEH suma o A103 X4 Got ak AAC 
静态 库 : 


$ go build -buildmode=c-archive -o sum.a sum.go 


如 果 没 有 错误 的 话 ， 以 上 编译 命令 将 生成 一 个 sum.a 静态 库 和 sumh 头 文件 。 其 中 sum.h X 
文件 将 包含 sum 函 数 的 声明 ， 静 态 库 中 将 包含 Sum 函数 的 实现 。 


要 分 析 生 成 的 C 语 言 版 Sum 函数 的 调用 流程 ， 同 样 需要 分 析 cgo 生 成 的 中 间 文 件 : 


$ go tool cgo main.go 


_obj 目 录 还 是 生成 类 似 的 中 间 文 件 。 为 了 查看 方便 ， 我 们 刻意 忽略 了 无 关 的 几 个 文件 : 


$ ls obj | awk '{print $NF} 
_cgo_export.c 

.cgo export.h 

cgo. gotypes.go 

main.cgo1.go 

main.cgo2.c 


其 中 cgo export.h 文件 的 内 容 和 生成 C 静 态 库 时 产生 的 sum.h 头 文件 是 同一 个 文件 ， 里 面 同 
TÉ &, 2 sum E Zt 6$ P5 8] e 


既然 C 语 言 是 主 调用 者 ， 我 们 需要 先 从 C 语 言 版 Sum 函数 的 实现 开始 分 析 。C 语 言 版 本 的 Sum 
FAE ERKI cgo export.c 文件 中 (该 文件 包含 的 是 Go 语言 导出 函数 对 应 的 C 语 言 函 数 实 
现 ) 


int sum(int pO, int pi) 
t 
SIZE TYPE cgo ctxt - cgo wait runtime init done(); 
struct ( 
int pO; 





int pi; 

int r0; 

char | pad0[4]; 
) attribute (( packed )) a; 
a.p0 = pO; 





a.pi = pi; 

.cgo tsan release(); 
crosscall2( cgoexp 8313eaf44386 sum, &a, 16, cgo ctxt); 
.cgo tsan acquire(); 

.cgo release context( cgo ctxt); 

return a.r0; 
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后 通过 runtime/cgo.crosscall2 函数 将 结构 体 传 给 cgoexp 8313eaf44386 sum 函数 执行 。 


runtime/cgo.crosscall2 函数 采用 汇编 语言 实现 ， 它 对 应 的 函数 声明 如 下 : 


func runtime/cgo.crosscall2( 
fn func(a unsafe.Pointer, n int32, ctxt uintptr), 
a unsafe.Pointer, n int32, 
ctxt uintptr, 
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中 间 的 _cgoexp_8313eaf44386_sum 代理 函数 在 . cgo. gotypes.go 文件 : 


func _cgoexp_8313eaf44386_sum(a unsafe.Pointer, n int32, ctxt uintptr) { 
fn := cgoexpwrap 8313eaf44386 sum 
.cgo runtime cgocallback(**(**unsafe.Pointer)(unsafe.Pointer(&fn)), a, uintptr(n), ct 


func | cgoexpwrap 8313eaf44386 sum(pO Ctype int, pi Ctype int) (rO Ctype int) { 
return sum(pO, p1) 





内 部 将 sum 的 包装 函数 .cgoexpwrap 8313eaf44386 sum 作为 函数 指针 ， 然 后 
由 .cgo runtime cgocallback 函数 完成 C 语 言 到 Go 有 函数 的 回调 工作 ? 


.cgo runtime cgocallback 函数 对 应 runtime.cgocallback 函数 ， 函 数 的 类 型 如 下 : 


func runtime.cgocallback(fn, frame unsafe.Pointer, framesize, ctxt uintptr) 


> 
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数 。 


É 


整个 调用 流程 图 如 下 : 


c call go func 
runtime/cgo/*.asm -cgo types.go 


-testmain.c -cgo.export.c 
int maino { 
extern int sum(nt a, int b) 







main.go 


sum(1, 2) 
return 0 








int sumünt pO, int p1) ( 
struct { int pO, p1, r0; }a 
xt = .cgo. wait, runtime. init. donei 


-cgo 0 
crosscall2 (.cgoexp. xxx. sum, &a, 16, .cgo.ctxt) 
90. release. context(. cgo. ctxt) 

return a.rO 








TEXT crosscall2 SB), NOSPLIT, $0 


一 一 


func .cgoexp. xxx. sum(a unsafe.Pointer, n int32, ctxt uintptr) ( 
fn:= .cgoexpwrap. xxx. sum 
-cgo. runtime. cgocallback( 
-tgoexpwrap xxx. sum, 


) 
func .cgoexpwrap. xxx. sum(pO, p1) ro ( 
return sum(pO, p1) 
ti 












) 











[l'export sum 
func sum(a, b C.int) C.int ( 
return a + b 








TEXT crosscall2 (5B), NOSPLIT, $ 





————— 





è 


其 中 runtime.cgocallback P 
以 参考 相关 函数 的 实现 。 
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数 跨 界 调用 的 关键 。 更 详细 的 细节 可 


2.6. 实战 : 封装 qsort 


qsort 快 速 排序 函数 是 C 语 言 的 高 阶 函 数 ， 支 持 用 于 自 定义 排序 比较 函数 ， 可 以 对 任意 类 型 的 
数组 进行 排序 。 本 节 我 们 尝试 基于 C 语 言 的 qsort 函 数 封装 一 个 Go 语言 版 本 的 qsort 函 数 。 


iJ qsort £2 
qsort 快 速 排序 函数 有 <stdlib.h> 标准 库 提供 ， 函 数 的 声明 如 下 : 


void qsort( 
void* base, size t num, size t size, 
int (*cmp)(const void*, const void*) 


其 中 base 参 数 是 要 排序 数组 的 首 个 元 素 的 地 址 ，num 是 数组 中 元 素 的 个 数 ，size 是 数组 中 每 个 
元 素 的 大 小 。 最 关键 是 cmp 比 较 函 数 ， 用 干 对 数组 中 任意 两 个 元 素 进行 排序 。cmp 排 序 函 数 的 
两 个 指针 参数 分 别 是 要 比较 的 两 个 元 素 的 地 址 ， 如 果 第 一 个 参数 对 应 元 素 大 于 第 二 个 参数 对 
应 的 元 素 将 返回 结果 大 于 0， 如 果 两 个 元 素 相 等 则 返回 0， 如 果 第 一 个 元 素 小 于 第 二 个 元 素 则 
返回 结果 小 于 0 。 


下 面 的 例子 是 用 C 语 言 的 qsort 对 一 个 int 类 型 的 数组 进行 排序 : 


include <stdio.h> 
include <stdlib.h> 


zdefine DIM(x) (sizeof(x)/sizeof((x)[0])) 


static int cmp(const void* a, const void* b) ( 
const int* pa - (int*)a; 
const int* pb - (int*)b; 
return *pa - *pb; 


int main() { 
int values[] = ( 42, 8, 109, 97, 23, 25 Y; 
ates: 


qsort(values, DIM(values), sizeof(values[90]), cmp); 


for(i = 0; i < DIM(values); i++) { 
printf ("%d ",values[i]); 
} 


return 9; 


其 中 DIM(values) 宏 用 于 几 十 数组 元 素 的 个 数 ” sizeof(values[0]) 用 于 计算 数组 元 素 的 大 
小 。 cmp 有 是 用 于 排序 时 比较 两 个 元 素 大 小 的 回调 函数 。 为 了 避免 对 全 局 名 字 空 间 的 污染 ， 我 
们 将 cmp 回 调 函 数 定义 为 仅 当 前 文件 内 可 方位 的 静态 函数 。 


1f qsort i ZUA Go 6, 3 Hi 
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可 以 访问 的 Go 函数 。 


用 Go 语言 将 qsort 函 数 重新 包装 为 qsort.sort 函数 : 


package qsort 


//typedef int (*qsort cmp func t)(const void* a, const void* b); 
import "C" 
import "unsafe" 


func Sort( 
base unsafe.Pointer, num, size C.size t, 
cmp C.qsort cmp func t, 

)4 


C.qsort(base, num, size, cmp) 


为 Go 语言 的 CGO 语言 不 好 直接 表达 C 语 言 的 函数 类 型 ， 因 此 在 C 语 言 空间 将 比较 函数 类 型 


重新 定义 为 一 个 qsort cmp func t 类 型 。 


虽然 Sort 函 数 已 经 导出 了 ， 但 是 对 于 qsort 包 之 外 的 用 户 依 然 不 能 直角 使 用 该 函数 一 一 Sort 函 数 
的 参数 还 包含 了 虚拟 的 C 包 提供 的 类 型 。 在 CGO 的 内 部 机 制 一 节 中 我 们 已 经 提 过 ， 虚 拟 的 C 
包 下 的 任何 名 称 其 实 都 会 被 映射 为 包 内 的 私有 名 字 。 比 如 c.sizet 会 被 展开 


为 .Ctype size t ? C.qsort cmp func t 类 型 会 被 展开 为 Ctype qsort cmp func t ? 





被 CGO 处 理 后 的 Sort 函 数 的 类 型 如 下 : 


func Sort( 
base unsafe.Pointer, num, size Ctype size t, 
cmp -Ctype qsort cmp func t, 





这 样 将 会 导致 包 外 部 用 于 无 法 构造 Ctype size t 和 Ctype qsort cmp func t 类 型 的 参数 而 
无 法 使 用 Sort 函 数 。 因 此 ， 寻 出 的 Sort 函 数 的 参数 和 返回 值 要 避免 对 虚拟 C 包 的 依赖 。 





重新 调整 Sort 函 数 的 参数 类 型 和 实现 如 下 : 


Z5 
4&include <stdlib.h> 


typedef int (*qsort cmp func t)(const void* a, const void* b); 
v 

import "C" 

import "unsafe" 


type CompareFunc C.qsort cmp func t 


func Sort(base unsafe.Pointer, num, size int, cmp CompareFunc) { 
C.qsort(base, C.size t(num), C.size t(size), C.qsort cmp func t(cmp)) 


} 


我 们 将 虚拟 C 包 中 的 类 型 通过 Go 语言 类 型 代替 ， 在 内 部 调用 C 函 数 时 重新 转型 为 C 函 数 需要 的 
类 型 。 因 此 外 部 用 户 将 不 再 依赖 qsort 包 内 的 虚拟 C 包 。 


以 下 代码 展示 的 Sort 函 数 的 使 用 方式 ; 


package main 


//extern int go qsort compare(void* a, void* b); 


Import eek 


import ( 
和 
"unsafe" 


qsort "." 


) 


//export go gqsort compare 

func go qsort compare(a, b unsafe.Pointer) C.int { 
pa, pb :- (*C.int)(a), (*C.int)(b) 
return C.int(*pa - *pb) 

} 


func main() { 
values := []int32[42, 9, 101, 95, 27, 25) 


qsort.Sort(unsafe.Pointer(&values[0]), 
len(values), int(unsafe.Sizeof(values[9])), 
qsort.CompareFunc(C.go qsort compare), 


) 


fmt.Println(values) 
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用 参数 ， 同 时 还 需要 提 过 一 个 C 语 言 规格 的 比较 函数 。 其 中 go_qsort_compare 是 用 Go 语言 实 
现 的 ， 并 导出 到 C 语 言 空间 的 函数 ， 用 于 qsort 排 序 时 的 比较 函数 。 


目前 已 经 实现 了 对 C 语 言 的 qsort 初 步 包 装 ， 并 且 可 以 通过 包 的 方式 被 其 它 用 户 使 用 。 但 

是 qsort.Sort 函数 已 经 有 很 多 不 便 使 用 之 处 : 用 户 要 提 过 C 语 言 的 比较 函数 ， 这 对 许多 Go 语 
言 用 户 是 一 个 挑战 。 下 一 步 我 们 将 继续 改进 qsort 函 数 的 包装 函数 ， 尝 试 通过 闭 包 函数 代替 C 
语言 的 比较 函数 。 


消除 用 户 对 CGO 代码 的 直角 依赖 。 


改进 : 财 包 函数 作为 比较 函数 
在 改进 之 前 我 们 先 回顾 下 Go 语言 sort 包 自 带 的 排序 函数 的 接口 : 


func Slice(slice interface([), less func(i, j int) bool) 


标准 库 的 sort.Slice 因 为 支持 通过 闭 包 函数 指定 比较 函数 ， 对 切片 的 排序 非常 简单 : 


import "sort" 


func main() { 
values := []int32(42, 9, 101, 95, 27, 25} 


sort.Slice(values, less func(i, j int) bool { 
return values[i] « values[j] 


}) 


fmt.Println(values) 


我 们 也 尝试 将 C 语 言 的 qsort 函 数 包 装 为 以 下 格式 的 Go 语言 函数 : 


package qsort 


func Sort(base unsafe.Pointer, num, size int, cmp func(a, b unsafe.Pointer) int) 
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此 我 们 可 以 用 Go 构造 一 个 可 以 导出 为 C 语 言 的 代理 函数 ， 然 后 通过 一 个 全 局 变量 临时 保存 当 
前 的 闭 包 比 较 函 数 。 


代码 如 下 : 


var go_qsort_compare_info struct { 
fn func(a, b unsafe.Pointer) int 
sync.Mutex 


//export cgo qsort compare 
func cgo qsort compare(a, b unsafe.Pointer) C.int { 
return C.int(go qsort compare info.fn(a, b)) 


其 中 导出 的 C 语 言 函 数 cgo qsort compare 是 公用 的 qsort 比 较 函 数 ， 内 部 通 
过 go qsort compare info.fn 来 调用 当前 的 闭 包 比较 函数 。 


新 的 Sort 包 装 函 数 实现 如 下 : 


irt cmp func t)(const void* a, const void* b); 





cgo qsort compare(void* a, void* b); 

import "C" 

func Sort(base unsafe.Pointer, num, size int, cmp func(a, b unsafe.Pointer) int) { 
go qsort compare info.Lock() 
defer go qsort compare info.Unlock() 


go qsort compare info.fn - cmp 


C.qsort(base, C.size t(num), C.size t(size), 
C.qsort cmp func t(C. cgo qsort compare), 





每 次 排序 前 ， 对 全 局 的 go_qsort compare info 变 量 加 锁 ， 同 时 将 当前 的 闭 包 函数 保存 到 全 局 
变量 ， 然 后 调用 C 语 言 的 qsort 函 数 。 


基于 新 包装 的 函数 ， 我 们 可 以 简化 之 前 的 排序 代码 : 


func main() { 
values := []int32(42, 9, 101, 95, 27, 25) 


qsort.Sort(unsafe.Pointer(&values[90]), ien(values), int(unsafe.Sizeof(values[9])), 
func(a, b unsafe.Pointer) int { 
pa, pb :- (*int32)(a), (*int32)(b) 
return int(*pa - *pb) 


Lh 


fmt.Println(values) 


现在 排序 不 再 需要 通过 CGO 实 现 C 语 言 版 本 的 比较 函数 了 ， 可 以 传 入 Go 语言 闭 包 元 数 作 为 比 


较 函 数 。 但 是 导入 的 排序 函数 依然 依赖 Unsafe 包 ， 这 是 违背 Go 语言 编程 习惯 的 。 


改进 : 消除 用 户 对 unsafe 包 的 依赖 


前 一 个 版 本 的 qsort.Sort 包 装 函 数 已 经 比 最 初 的 C 语 言 版 本 的 qsort 易 用 很 多 ， 但 是 依然 保留 了 
很 多 C 语 言 底层 数据 结构 的 细节 。 现在 我 们 将 继续 改进 包装 函数 ， 尝 试 消除 对 unsafe 包 的 依 
赖 ， 并 实现 一 个 类 似 标准 库 中 sort.Slice 的 排序 函数 。 


新 的 包装 函数 声明 如 下 : 


package qsort 


func Slice(slice interface{}, less func(a, b int) bool) 


首先 ， 我 们 将 slice 作 为 接口 类 型 参数 传 入 ， 这 样 可 以 适 配 不 同 的 切片 类 型 。 然后 切片 的 首 个 
元 素 的 地 址 、 元 素 个 数 和 元 素 大 小 可 以 通过 reflect 反 射 包 从 切片 中 获取 。 


为 了 保存 必要 的 排序 上 下 文 信息 ， 我 们 需要 在 全 局 包 变量 增加 要 排序 数组 的 地 址 、 元 素 个 数 
和 元 素 大 小 等 信息 ， 比 较 函 数 改 为 |ess : 


var go qsort compare info struct { 
base unsafe.Pointer 
elemnum int 
elemsize int 
less func(a, b int) bool 
sync.Mutex 


同样 比较 函数 需要 根据 元 素 指针 、 排 序数 组 的 开始 地 址 和 元 素 的 大 小 计算 出 元 素 对 应 数组 的 


索引 下 标 ， 然 后 根据 less 况 数 的 比较 结果 返回 qsort 吕 数 需要 格式 的 比较 结果 。 


//export cgo qsort compare 


func |cgo qsort compare(a, b unsafe.Pointer) C.int { 


var ( 
// array memory is locked 
base - uintptr(go qsort compare info.base) 
elemsize - uintptr(go qsort compare info.elemsize) 
) 
i := int((uintptr(a) - base) / elemsize) 
j := int((uintptr(b) - base) / elemsize) 
switch { 


case go qsort compare info.less(i, j): // v[i] < v[j] 
reium 

case go qsort compare info.less(j, i): // v[i] > v[j] 
fie EUIS: 

default: 
return 0 


新 的 Slice 函 数 的 实现 如 下 : 


func Slice(slice interface(), less func(a, b int) bool) { 
sv := reflect.ValueOf(slice) 
if sv.Kind() !- reflect.Slice { 
panic(fmt.Sprintf("qsort called with non-slice value of type %T", slice)) 


} 

if sv.Len() = 0 ( 
return 

} 


go qsort compare info.Lock() 
defer go qsort compare info.Unlock() 


defer func() 1 
go qsort compare info.base - nil 
go qsort compare info.elemnum = 0 
go qsort compare info.elemsize - 0 
go qsort compare info.less - nil 


}() 


// baseMem = unsafe.Pointer(sv.Index(0).Addr().Pointer()) 

// baseMem maybe moved, so must saved after call C.fn 

go qsort compare info.base = unsafe.Pointer(sv.Index(0).Addr().Pointer()) 
go qsort compare info.elemnum - sv.Len() 

go qsort compare info.elemsize - int(sv.Type().Elem().Size()) 

go qsort compare info.less - less 


C.qsort( 
go qsort compare info.base, 
C.size t(go qsort compare info.elemnum), 
C.size t(go qsort compare info.elemsize), 
C.qsort cmp func t(C. cgo qsort compare), 





首先 需要 判断 传 入 的 接口 类 型 必须 是 切片 类 型 。 然 后 通过 反射 获取 qsort 函 数 需要 的 切片 信 
息 ， 并 调用 C 语 言 的 qsort 函 数 。 


基于 新 包装 的 沟 数 我 们 可 以 采用 和 标准 库 相 似 的 方式 排序 切片 : 


import ( 
"EMES 


qsort "." 


) 


func main() { 
values := []int64(42, 9, 101, 95, 27, 25) 


qsort.Slice(values, func(i, j int) bool { 
return values[i] « values[j] 


}) 


fmt.Println(values) 


为 了 避免 在 排序 过 程 中 ， 排 序数 组 的 上 下 文 信息 go qsort compare info 被 修改 ， 我 们 进行 了 
全 局 加 锁 。 因此 目前 版 本 的 qsort.Slice 函 数 是 无 法 并 发 执行 的 ， 读 者 可 以 自己 尝试 改进 这 个 
限制 。 


2.7. CGO 内 存 模 型 


CGO 是 架 接 Go 语言 和 C 语 言 的 桥 粱 ， 它 使 二 者 在 二 进 制 接口 层面 实现 了 互通 ， 但 是 我 们 要 注 
意 因 两 种 语言 的 内 存 模型 的 差异 而 可 能 引起 的 问题 。 如 果 在 CGO 处 理 的 跨 语言 函数 调用 时 涉 

及 到 了 指针 的 传递 ， 则 可 能 会 出 现 GO 语言 和 C 语 言 共享 某 一 段 内 存 的 场景 。 我 们 知道 C 语 言 的 
内 存在 分 配 之 后 就 是 稳定 的 ， 但 是 Go 语言 因为 函数 栈 的 动态 伸缩 可 能 导致 栈 中 内 存 地 址 的 移 

动 (这 是 Go 和 C 内 存 模型 的 最 大 差异 )。 如 果 C 语 言 桂 有 的 是 移动 之 前 的 Go 指针 ， 那 么 以 旧 指 针 
访问 GO 对 象 时 会 导致 程序 崩溃 。 


Go 访问 C 内 存 


C 语 言 空间 的 内 存 是 稳定 的 ， 只 要 不 是 被 人 为 提前 释放 ， 那 么 在 Go 语言 空间 可 以 放心 大 胆 地 
使 用 。 在 Go 语言 访问 Ci 语言 内 存 是 最 简单 的 情形 ， 我 们 在 之 前 的 例子 中 已 经 见 过 多 次 。 
因为 Go 语言 实现 的 限制 ， 我 们 无 法 在 Go 语言 中 创建 大 于 2GB 内 存 的 切片 〈 有 具体 请 参考 


makeslice 实 现代 码 ) 。 不 过 借助 cgo 技 术 ， 我 们 可 以 在 C 语 言 环 境 创建 大 于 2GB 的 内 存 ， 然 后 
转 为 Go 语言 的 切片 使 用 : 


package main 


/* 


#include <stdlib.h> 


void* makeslice(size_t memsize) { 


return malloc(memsize); 


import "C" 
import "unsafe" 


func makeByteSlize(n int) []byte { 
p := C.makeslice(C.size t(n)) 
return ((*[1 << 31]byte)(p)) [0:n:n] 
} 


func freeByteSlice(p []byte) { 
C.free(unsafe.Pointer(&p[09])) 


} 


func main() { 
s := makeByteSlize(1<<32+1) 
s[len[s]-1] = 1234 
print(s[len[s]-1]) 
freeByteSlice(p) 


例子 中 我 们 通过 makeByteSlize 来 创建 大 于 4G 内 存 大 小 的 切片 ， 从 而 绕 过 了 Go 语言 实现 的 限 
制 (需要 代码 验证 ) 。 而 freeByteSlice 辅 助 函 数 则 用 于 释放 从 C 语 言 函 数 创建 的 切片 。 


因为 C 语 言 内 存 空 间 是 稳定 的 ， 基 于 C 语 言 内 存 构造 的 切片 也 是 绝对 稳定 的 ， 不 会 因为 Go 语言 
栈 的 变化 而 被 移动 。 


C 临 时 访问 传 入 的 Go 内存 


cgo 之 所 以 存在 的 一 大 因素 是 为 了 方便 在 Go 语言 中 接纳 吸收 过 去 几 十 年 来 使 用 C/C++ 语言 软件 
构建 的 大 量 的 软件 资源 。C/C++ 很 多 库 都 是 需要 通过 指针 直接 处 理 传 入 的 内 存 数 据 的 ， 因 此 
cgo 中 也 有 很 多 需要 将 Go 内 存 传 入 C 语 言 函 数 的 应 用 场景 。 


假设 一 个 极端 场景 : 我 们 将 一 块 位 于 某 goroutinue 的 栈 上 的 Go 语言 内 存 传 入 了 Ci 语言 函数 后 ， 
在 此 Ci 语言 函数 执行 期 间 ， 此 goroutinue 的 栈 因 为 空间 不 足 的 原因 发 生 了 扩展 ， 也 就 是 导致 了 
原来 的 Go 语言 内 存 被 移动 到 了 新 的 位 置 。 但 是 此 时 此 刻 C 语 言 函 数 并 不 知道 该 Go 语言 内 存 已 
经 移动 了 位 置 ， 仍 然 用 之 前 的 地 址 来 操作 该 内 存 一 一 这 将 将 导致 内 存 越界 。 以 上 是 一 个 推论 
(真实 情况 有 些 差 异 ) ， 也 就 是 说 C 访 问 传 入 的 Go 内 存 可 能 是 不 安全 的 | 


当然 有 RPC 远 程 过 程 调用 的 经 验 的 用 户 可 能 会 考虑 通过 完全 传 值 的 方式 处 理 : 借助 C 语 言 内 存 
稳定 的 特性 ， 在 Ci 语言 空间 先 开辟 同样 大 小 的 内 存 ， 然 后 将 Go 的 内 存 填 充 到 C 的 内 存 空间 ; 返 
回 的 内 存 也 是 如 此 处 理 。 下 面 的 例子 是 这 种 思路 的 具体 实现 : 


package main 


/* 

void printString(const char* s) ( 
poeni (os ES 

j 

*/ 

Import nei 


func printString(s string) { 
cs := C.CString(s) 


defer C.free(unsafe.Pointer(cs)) 


C.printString(cs) 


} 

func main() { 
Ss hello, 
printString(s) 


在 需要 将 Go 的 字符 串 传 入 C 语 言 时 ， 先 通过 c.cstring 将 Go 语言 字符 串 对 应 的 内 存 数据 复制 
到 新 创建 的 C 语 言 内 存 空间 上 。 上 面 例子 的 处 理 思 路 虽然 是 实 全 的 ， 但 是 效率 极其 低下 (因为 
要 多 次 分 配 内 存 并 逐个 复制 元 素 ) ， 同 时 也 极其 繁琐 。 


为 了 简化 并 高 效 处 理 此 种 向 C 语 言传 入 Go 语言 内 存 的 问题 ，cgo 针 对 该 场景 定义 了 专门 的 规 
Wl : 在 CGO 调用 的 C 语 言 函 数 返 回 前 ，cgo 保 证 传 入 的 Go 语言 内 存在 此 期 间 不 会 发 生 移动 ，C 
语言 函数 可 以 大 胆 地 使 用 Go 语言 的 内 存 ! 


根据 新 的 规则 我 们 可 以 直接 传 入 Go 字符 串 的 内 存 : 


package main 


import "C" 


func printString(s string) { 
C.printString((*C.char)(unsafe.Pointer(&s[9]))) 


H 

func main() { 
S :- "hello" 
printString(s) 


现在 的 处 理 方式 更 加 直接 ， 且 避免 了 分 配额 外 的 内 存 。 完 美的 解决 方案 ! 


任何 完美 的 技术 都 有 被 滥用 的 时 候 ，CGO 的 这 种 看 似 完美 的 规则 也 是 存在 隐患 的 。 我 们 假设 
调用 的 C 语 言 函 数 需 要 长 时 间 运 行 ， 那 么 将 会 导致 被 他 引用 的 Go 语言 内 存在 C 语 言 返回 前 不 能 
被 移动 ， 从 而 可 能 间接 地 导致 这 个 Go 内 存 栈 对 应 的 goroutine 不 能 动态 伸缩 栈 内 存 ， 也 就 是 可 
能 导致 这 个 goroutine 被 阻塞 。 因 此 ， 在 需要 长 时 间 运 行 的 C 语 言 函 数 (特别 是 在 纯 CPU 运 算 
之 外 ， 还 可 能 因为 需要 等 待 其 它 的 资源 而 需要 不 确定 时 间 才 能 完成 的 函数 ) ， 需 要 谨 懂 处理 
传 入 的 Go 语言 内 存 。 

不 过 需要 小 心 的 是 在 取得 Go 内 存 后 需要 马上 传 入 C 语 言 函 数 ， 不 能 保存 到 临时 变量 后 再 间接 
传 入 C 语 言 函 数 。 因 为 CGO 只 能 保证 在 C 函 数 调 用 之 后 被 传 入 的 Go 语言 内 存 不 会 发 生 移动 ， 
它 并 不 能 保证 在 传 入 C 函 数 之 前 内 存 不 发 生变 化 。 


以 下 代码 是 错误 的 : 
// 错误 的 代码 
tmp := uintptr(unsafe.Pointer(&x)) 
pb := (*inti6)(unsafe.Pointer(tmp)) 


*pb = 42 


因为 tmp 并 不 是 指针 类 型 ， 在 它 获取 到 GO 对 象 地 址 之 后 x 对 象 可 能 会 被 移动 ， 但 是 因为 不 是 指 
针 类 型 ， 所 以 不 会 被 Go 语言 运行 时 更 新 成 新 内 存 的 地 址 。 在 非 指 针 类 型 的 tmp 保 持 GO 对 象 的 
地 址 ， 和 在 C 语 言 环境 保持 Go 对 象 的 地 址 的 效果 是 一 样 的 : 如 果 原 始 的 GO 对 象 内 存 发 生 了 移 
动 ，Go 语 言 运行 时 并 不 会 同步 更 新 它们 。 


C 长 期 持 有 Go 指针 对 象 
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也 可 以 回调 Go 语言 实现 的 函数 。 特 别 是 我 们 可 以 用 Go 语言 写 一 个 动态 库 ， 寻 出 C 语 言 规范 的 
接口 给 其 它 用 户 调用 。 当 C 语 言 函 数 调 用 Go 语言 函数 的 时 候 ，C 语 言 函 数 就 成 了 程序 的 调用 
方 ，Go 语 言 函 数 返 回 的 Go 对 象 内 存 的 生命 周期 也 就 自然 超出 了 Go 语言 运行 时 的 管理 。 简 言 
之 ， 我 们 不 能 在 C 语 言 函 数 中 直接 使 用 Go 语言 对 象 的 内 存 。 


虽然 Go 语言 禁止 在 C 语 言 函 数 中 长 期 持 有 Go 指针 对 象 ， 但 是 这 种 需求 是 切实 存在 的 。 如 果 需 
要 在 C 语 言 中 访问 Go 语言 内 存 对 象 ， 我 们 可 以 将 Go 语言 内 存 对 象 在 Go 语言 室 间 映射 为 一 个 int 
类 型 的 dl， 然 后 通过 此 id 来 间接 访问 和 控制 Go 语言 对 象 。 


以 下 代码 用 于 将 Go 对 象 映 射 为 整数 类 型 的 Objectld， 用 完 之 后 需要 手工 调用 free 方 法 释放 该 对 
象 ID : 


package main 
import "sync" 
type ObjectId int32 


var refs struct ( 
sync.Mutex 
objs map[Objectid]interface() 
next ObjectId 

} 


func init() { 
refs.Lock() 
defer refs.Unlock() 


refs.objs = make(map[ObjectId]interface()j) 
refs.next - 1000 


} 


func NewObjectId(obj interface{}) ObjectId { 
refs.Lock() 
defer refs.Unlock() 


id := refs.next 
refs.next++ 


refs.objs[id] = obj 
return id 


} 


func (id ObjectId) IsNil() bool { 
return id -- 0 


} 


func (id ObjectId) Get() interface{} { 
refs.Lock() 


defer refs.Unlock() 


return refs.objs[id] 


} 


func (id *ObjectId) Free() interface{} { 
refs.Lock() 
defer refs.Unlock() 


obj := refs.objs[*id] 
delete(refs.objs, *id) 


*id = 0 


return obj 


我 们 通过 一 个 map 来 管理 Go 语言 对 象 和 id 对 象 的 映射 关系 。 其 中 NewObjectld 用 于 创建 一 个 和 
对 象 绑 定 的 jd， 而 id 对 象 的 方法 可 用 于 解码 出 原始 的 Go 对 象 ， 也 可 以 用 于 结束 id 和 原始 Go 对 
象 的 绑 定 。 


下 面 一 组 函数 以 C 接 口 规范 导出 ， 可 以 被 C 语 言 函 数 调 用 : 


package main 


yt 

export char* NewGoString(char* ); 

export void FreeGoString(char* ); 

export void PrintGoString(char* ); 


void printString(const char* s) ( 
char* gs - NewGoString(s); 
PrintGoString(gs); 
FreeGoString(gs); 

} 

b 

import "C" 


//export NewGoString 
func NewGoString(s *C.char) *C.char { 
gs := C.GoString(s) 
id :- NewObjectId(gs) 
return (*C.char)(unsafe.Pointer(uintptr(id))) 


//export FreeGoString 

func FreeGoString(p *C.char) { 
id := ObjectId(uintptr(unsafe.Pointer(p))) 
id.Free() 


//export PrintGoString 

func PrintGoString(s *C.char) { 
id := ObjectiId(uintptr(unsafe.Pointer(p))) 
gs :- id.Get().(string) 
print(gs) 


func main() { 
C.printString("hello") 
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个 ID， 不 能 直接 使 用 。 我 们 借助 PrintGoString 函 数 将 id 解析 为 Go 语言 字符 串 后 打印 。 该 字符 
串 在 C 语 言 函 数 中 完全 跨越 了 Go 语言 的 内 存 管理 ， 在 PrintGoString 调 用 前 即使 发 生 了 栈 伸缩 
导致 的 Go 字符 串 地 址 发 生变 化 也 依然 可 以 正常 工作 ， 因 为 该 字符 串 对 应 的 id 是 稳定 的 ， 在 Go 
语言 空间 通过 id 解码 得 到 的 字符 串 也 就 是 有 效 的 。 


导出 C 函 数 不 能 返回 GO 内 存 


在 Go 语言 中 ，Go 是 从 一 个 国定 的 虚拟 地 址 空 配 内 存 。 而 C 语 言 分 配 的 内 存 则 不 能 使 用 Go 
语言 保留 的 虚拟 内 存 空 间 。 TOEN , icd RU 回 的 内 存 是 否 是 由 
Go 语言 分 配 的 ， 如 果 是 则 会 抛 出 运行 时 异常 。 


下 面 是 CGO 运行 时 异常 的 例子 : 


6 e 


xtern int* getGoPtr(); 


import "C" 


func main() { 


//ex 


C.Main() 


port getGoPtr 


func getGoPtr() *C.int ( 


return new(C.int) 


其 中 getGoPtr 返 回 的 虽然 是 C 语 言 类 型 的 指针 ， 但 是 内 存 本 身 是 从 Go 语言 的 new 函 数 分 配 ， 也 
就 是 由 GO 语言 运行 时 统 内 dd o RE RTECH E t Main cT AA f getGoPtr £i 
数 ， 此 时 默认 将 发 送 运行 时 异常 


$ go run main.go 


panic: runtime error: cgo result has Go pointer 


goroutine 1 [running]: 
main. cgoexpwrap cfb3840e3af2 getGoPtr.funci(0xc420051dc0) 


command-line-arguments/ obj/ cgo gotypes.go:60 -0x3a 


main. cgoexpwrap cfb3840e3af2 getGoPtr(0xc420016078) 


command-line-arguments/ obj/ cgo gotypes.go:62 -*0x67 


main. Cfunc Main() 


command-line-arguments/ obj/ cgo gotypes.go:43 +0x41 


main.main() 


/Users/chai/go/src/github.com/chai2010/advanced-go-programming-book/examples/ch2- 


exit status 2 


BE S 
常 说 明 cgo 函 数 返回 的 结果 中 含有 Go 语言 分 配 的 指针 。 指 针 的 检查 操作 发 生 在 C 语 言 版 的 
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下 面 是 cgo 生 成 的 C 语 言 版 本 getGoPtr 函 数 的 具体 细节 (在 cgo 生 成 的 _cgo_export.c 文件 定 
x) 


nt^ geteoPtr() 








{ 
SIZE_TYPE cgo_ctxt = _cgo_wait_runtime_init_done(); 
struct 4 
int* r0; 
) | attribute ((_packed_ )) a; 
.cgo tsan release(); 
crosscall2( cgoexp 95d42b8e6230 getGoPtr, &a, 8, cgo ctxt); 
.cgo tsan acquire(); 
.cgo release context( cgo ctxt); 
return a.r0; 
} 


其 中 _cgo_tsan_acquire 是 从 LLVM 项 目 移植 过 来 的 内 存 指 针 扫描 函数 ， 它 会 检查 cgo 函 数 返 回 
的 结果 是 否 包 含 Go 指针 。 


需要 说 明 的 是 ，cgo 默 认 对 返回 结果 的 指针 的 检查 是 有 代价 的 ， 特 别 是 cgo 有 函数 返回 的 结果 是 
一 个 复杂 的 数据 结构 时 将 花费 更 多 的 时 间 。 如 果 已 经 确保 了 cgo 函 数 返 回 的 结果 是 安全 的 话 ， 
可 以 通过 设置 环境 变量 copEBUG-cgocheck-e 来 关闭 指针 检查 行为 。 


$ GODEBUG-cgocheck-O go run main.go 
关闭 cgocheck 功 能 后 再 运行 上 面 的 代码 就 不 会 出 现 上 面 的 异常 的 。 但 是 要 注意 的 是 ， 如 果 C 


语言 使 用 期 间 对 应 的 内 存 被 Go 运行 时 释放 了 ， 将 会 导致 更 严重 的 前 溃 问 题 。cgocheck 默 认 的 
值 是 1， 对 应 一 个 简化 版 本 的 检测 ， 如 果 需 要 完整 的 检测 功能 可 以 将 cgocheck 设 置 为 2。 


关于 cgo 运 行 时 指针 检测 的 功能 详细 说 明 可 以 参考 Go 语言 的 官方 文档 。 


2.8. C++ 类 包装 


CGO 是 C 语 言 和 Go 语言 之 间 的 桥梁 ， 原 则 上 无 法 直接 支持 C++ 的 类 。CGO 不 支持 C++ 语法 的 
根本 原因 是 C++ 至 今 为 止 还 没有 一 个 二 进 制 接 口 规范 (ABI)。 一 个 C++ 类 的 构造 函数 在 编译 为 
目标 文件 时 如 何 生成 链接 符号 名 称 、 方 法 在 不 同 平台 甚至 是 C++ 的 不 同 版 本 之 间 都 是 不 一 样 
的 。 但 是 C++ 是 兼容 C 语 言 ， 所 以 我 们 可 以 通过 增加 一 组 C 语 言 函 数 接口 作为 C++ 类 和 CGO 之 
间 的 桥梁 ， 这 样 就 可 以 间接 地 实现 C++ 和 Go 之 间 的 互联 。 当 然 ， 因 为 CGO 只 支持 C 语 言 中 值 
类 型 的 数据 类 型 ， 所 以 我 们 是 无 法 直接 使 用 C++ 的 引用 参数 等 特性 的 。 


C++ 类 到 Go 语言 对 象 


实现 C++ 类 到 Go 语言 对 象 的 包装 需要 经 过 以 下 几 个 步骤 : 首先 是 用 纯 C 函 数 接口 包装 该 
C++ 类 ; 其 次 是 通过 CGO 将 纯 C 函 数 接口 映射 到 Go 函数 ; 最 后 是 做 一 个 Go 包装 对 象 ， 将 
C++ 类 到 方法 用 Go 对 象 的 方法 实现 。 


准备 一 个 C++ 类 


为 了 演示 简单 ， 我 们 基于 std::string 做 一 个 最 简单 的 缓存 类 MyBuffer。 除 了 构造 函数 和 析 构 
函数 之 外 ， 只 有 两 个 成 员 函 数 分 别 是 返回 底层 的 数据 指针 和 绥 存 的 大 小 。 因 为 是 二 进 制 绥 
存 ， 所 以 我 们 可 以 在 里 面 中 放置 任意 数据 。 


// my buffer.h 


4include «string» 


struct MyBuffer { 
Sis: seringi ss; 


MyBuffer(int size) { 

this-»s  - new std::string(size, char('*0')); 
} 
~MyBuffer() { 

delete this->s ; 


} 


int Size() const ( 
return this-»s -»size(); 
} 
char* Data() 1 
return (char*)this-»s -»data(); 
} 
n 


我 们 在 构造 函数 中 指定 缓存 的 大 小 并 分 配 空间 ， 在 使 用 完 之 后 通过 析 构 函数 释放 内 部 分 配 的 
内 存 空间 。 下 面 是 简单 的 使 用 方式 : 


int main() { 
auto pBuf - new MyBuffer(1024); 


auto data = pBuf-»Data(); 
auto size = pBuf-»Size(); 


delete pBuf; 
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和 delete 来 分 配 和 释放 缓存 对 象 ， 而 不 能 以 值 风格 的 方式 来 使 用 。 
用 纯 C 函 数 接口 封装 C++ 类 


如 果 要 将 上 面 的 C++ 类 用 C 语 言 函 数 接口 封装 ， 我 们 可 以 从 使 用 方式 入 手 。 我 们 可 以 将 new 和 
delete 映 射 为 C 语 言 函 数 ， 将 对 象 的 方法 也 映射 为 C 语 言 函 数 。 


在 C 语 言 中 我 们 期 望 MyBuffer 类 可 以 这 样 使 用 : 


int main() ( 
MyBuffer* pBuf = NewMyBuffer(1024); 


char* data - MyBuffer Data(pBuf); 
auto size - MyBuffer Size(pBuf); 


DeleteMyBuffer (pBuf); 


先 从 C 语 言 接 口 用 户 的 角度 思考 需要 什么 样 的 接口 ， 然 后 创建 ny buffer capi.n. 头 文 件 接口 
规范 : 


// my buffer capi.h 
typedef struct MyBuffer T MyBuffer T; 


MyBuffer T* NewMyBuffer(int size); 
void DeleteMyBuffer(MyBuffer T* p); 


char* MyBuffer Data(MyBuffer T* p); 


int MyBuffer Size(MyBuffer T* p); 


然后 就 可 以 基于 C++ 的 MyBuffer 类 定义 这 些 C 语 言 包装 函数 。 我 们 创建 对 应 
的 my buffer capi.cc 文件 如 下 : 


// my buffer capi.cc 


4include "./my buffer.h" 


extern "c" T 
zinclude "./my buffer capi.h" 


struct MyBuffer T: MyBuffer ( 
MyBuffer T(int size): MyBuffer(size) {} 
-MyBuffer T() (3 

}; 


MyBuffer T* NewMyBuffer(int size) ( 
auto p - new MyBuffer T(size); 


return p; 

} 

void DeleteMyBuffer(MyBuffer_T* p) { 
delete p; 

} 


char* MyBuffer Data(MyBuffer T* p) { 
return p-»Data(); 


} 
int MyBuffer Size(MyBuffer T* p) { 
return p-»Size(); 


因为 头 文 件 my buffer capi.h 是 用 于 CGO， 必 须 是 采用 C 语 言 规范 的 名 字 修 饰 规则 o 在 
C++ 源 文件 包含 时 需要 用 extern "c" 语 名 说明。 另外 MyBuffer T 的 实现 只 是 从 MyBuffer 继 承 
的 类 ， 这 样 可 以 简化 包装 代码 的 实现 。 同 时 和 CGO 通信 时 必须 通过 MyBuffer_T 指针 ， 我 们 无 
法 将 具体 的 实现 暴露 给 CGO， 因 为 实现 中 包含 了 C++ 特有 的 语法 ，CGO 无 法 识别 C++ 特性 。 


将 C++ 类 包装 为 纯 C 接 口 之 后 ， 下 一 步 的 工作 就 是 将 C 函 数 转 为 Go 函数 。 
将 纯 C 接 口 函 数 转 为 Go 元 数 


将 纯 C 函 数 包装 为 对 应 的 Go 函数 的 过 程 比较 简单 。 需 要 注意 的 是 ， 因 为 我 们 的 包 中 包含 
C++11 的 语法 ， 因 此 需要 通过 #cgo CXXFLAGS: -std=c++11 打开 C++11 的 选项 。 


// my buffer capi.go 
package main 


/* 


&cgo CXXFLAGS: -std=c++11 


&include "my buffer capi.h" 
x/ 


import "C" 
type cgo MyBuffer T C.MyBuffer T 
func cgo NewMyBuffer(size int) *cgo MyBuffer T ( 


p := C.NewMyBuffer(C.int(size)) 
return (*cgo MyBuffer T)(p) 


func cgo DeleteMyBuffer(p *cgo MyBuffer T) { 
C.DeleteMyBuffer((*C.MyBuffer T)(p)) 


func cgo MyBuffer Data(p *cgo MyBuffer T) *C.char { 
return C.MyBuffer Data((*C.MyBuffer T)(p)) 


func cgo MyBuffer Size(p *cgo MyBuffer T) C.int { 
return C.MyBuffer Size((*C.MyBuffer T)(p)) 


为 了 区 分 ， 我 们 在 Go 中 的 每 个 类 型 和 函数 名 称 前 面 增加 了 cgo 前 组， 比如 cgo_MyBuffer T 
是 对 应 C 中 的 MyBuffer T 类 型 。 


为 了 处 理 简单 ， 在 包装 纯 C 函 数 到 Go 函数 时 ， 除 了 cgo_MyBuffer T 类 型 外 ， 对 输入 参数 和 返 
回 值 的 基础 类 型 ， 我 们 依然 是 用 的 C 语 言 的 类 型 。 
包装 为 Go 对 象 


在 将 纯 C 接 口 包装 为 Go 函数 之 后 ， 我 们 就 可 以 很 容易 地 基于 包装 的 Go 函数 构造 出 Go 对 象 来 。 
为 cgo_MyBuffer T 是 从 C 语 言 空间 导入 的 类 型 ， 它 无 法 定义 自己 的 方法 ， 因 此 我 们 构造 了 
一 个 新 的 MyBuffer 类 型 ， 里 面 的 成 员 持 有 cgo_MyBuffer T 指 向 的 C 语 言 缓存 对 象 。 


// my buffer.go 
package main 
import "unsafe" 


type MyBuffer struct ( 
cptr *cgo MyBuffer T 


func NewMyBuffer(size int) *MyBuffer ( 
return &MyBuffer( 
cptr: cgo NewMyBuffer(size), 


func (p *MyBuffer) Delete() { 
cgo DeleteMyBuffer(p.cptr) 


func (p *MyBuffer) Data() []byte { 
data :- cgo MyBuffer Data(p.cptr) 
size :- cgo MyBuffer Size(p.cptr) 
return ((*[1 << 31]byte)(unsafe.Pointer(data)))[0:int(size):int(size)] 


同时 ， 因 为 Go 语言 的 切片 本 身 含 有 长 度 信息 ， 我 们 将 cgo_MyBuffer_Data 和 
cgo_MyBuffer_Size 两 个 函数 合并 为 MwyBuffer.Data 方法 ， 它 返回 一 个 对 应 底层 C 语 言 缓存 空 
间 的 切片 。 


现在 我 们 就 可 以 很 容易 在 Go 语言 中 使 用 包装 后 的 缓存 对 象 了 【底层 是 基于 
C++ 的 std::string 实现 ) 


package main 


//#include <stdio.h> 
import "C" 
import "unsafe" 


func main() { 
buf := NewMyBuffer (1024) 
defer buf.Delete() 


copy(buf.Data(), []byte("helloNx00")) 
C.puts((*C.char)(unsafe.Pointer(&(buf.Data()[9])))) 
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们 直接 获取 缓存 的 底层 数据 指针 ， 用 C 语 言 的 puts 函 数 打印 缓存 的 内 容 。 


Go 语言 对 象 到 C++ X 


要 实现 Go 语言 对 象 到 C++ 类 的 包装 需要 经 过 以 下 几 个 步骤 : 首先 是 将 Go 对 象 映 射 为 一 个 id ; 
REA Tid db e yc ud ; 最 后 是 基于 C 接 口 函 数 包 装 为 C++ 对 象 。 
构造 一 个 Go 对 象 


为 了 便于 演示 ， 我 们 用 Go 语言 构建 了 一 个 Person 对 象 ， 每 个 Person 可 以 有 名 字 和 年 龄 信息 : 


package main 


type Person struct { 
name string 
age int 


} 


func NewPerson(name string, age int) *Person { 
return &Person{ 
name: name, 


age: age, 


func (p *Person) Set(name string, age int) { 
p.name - name 
p.age - age 


} 


func (p *Person) Get() (name string, age int) { 
return p.name, p.age 


} 


Person 对 象 如 果 想 要 在 C/C++ 中 访问 ， 需 要 通过 cgo 导 出 C 接 口 来 访问 。 


导出 C 接 口 


jid 前 面 仿照 C++ 对 象 到 C 接 口 的 过 程 ， 也 抽象 一 组 C 接 口 描述 Person 对 象 。 创 建 一 
个 person capi.h 文件 ， 对 应 C 接 口 规范 文件 : 


// person capi.h 
zinclude «stdint.h-» 


typedef uintptr t person handle t; 


person handle t person new(char* name, int age); 
void person delete(person handle t p); 


void person set(person handle t p, char* name, int age); 


char* person get name(person handle t p, char* buf, int size); 


int person get age(person handle t p); 


然后 是 在 Go 语言 中 实现 这 一 组 C 函 数 。 


需要 注意 的 是 ， 通 过 CGO 导出 C 函 数 时 ， 输 入 参数 和 返回 值 类 型 都 不 支持 const 修 饰 ， 同 时 也 
不 支持 可 变 参 数 的 函数 类 型 。 同 时 如 内 存 模式 一 节 所 述 ， 我 们 无 法 在 C/C++ 中 直接 长 期 访问 
Go 内 存 对 象 。 因 此 我 们 使 用 前 一 节 所 讲述 的 技术 将 Go 对 象 映 射 为 一 个 整数 id 。 


下 面 是 person_capi.go X fF * HECO f SEE : 


// person capi.go 


package main 


//ttànclude "./person capi.h" 
import Ee 
import "unsafe" 


//export person_new 

func person new(name *C.char, age C.int) C.person handle t { 
id := NewObjectId(NewPerson(C.GoString(name), int(age))) 
return C.person handle t(id) 


//export person delete 
func person delete(h C.person handle t) { 
ObjectId(h).Free() 


//export person set 

func person set(h C.person handle t, name *C.char, age C.int) ( 
p := ObjectId(h).Get().(*Person) 
p.Set(C.GoString(name), int(age)) 


//export person get name 

func person get name(h C.person handle t, buf *C.char, size C.int) *C.char ( 
p := ObjectId(h).Get().(*Person) 
name, _ := p.Get() 


n := int(size) - 1 

bufSlice := ((*[1 << 31]byte)(unsafe.Pointer(buf)))[0:n:n] 
n - copy(bufSlice, []byte(name)) 

bufSlice[n] = 9 


return buf 


//export person get age 

func person get age(h C.person handle t) C.int { 
p := ObjectId(h).Get().(*Person) 
., age :- p.Get() 
return C.int(age) 


在 创建 Go 对 象 后 ， 我 们 通过 NewObjectld 将 Go 对 应 映射 为 id。 然后 将 id 强制 转 义 为 
person handle t 类 型 返回 。 其 它 的 接口 函数 则 是 根据 person_handle t 所 表示 的 id， 让 根据 id 
解析 出 对 应 的 Go 对 象 。 


封装 C++ 对 象 


有 了 C 接 口 之 后 封装 C++ 对 象 就 比较 简单 了 。 常 见 的 做 法 是 新 建 一 个 Person 类 ， 里 面包 含 一 个 
person handle t3& 78 65 yx, pi sq E 5 3c con ， 然 后 在 Person 类 的 构造 函数 中 通过 C 接 口 创 
建 GO 对 象 ， 在 析 构 函数 中 通过 C 接 口 释放 GO 对 疹 。 下 面 是 采用 这 种 技术 的 实现 : 


extern "c" T 
4include "./person capi.h" 


struct Person { 
person handle t goobj ; 


Person(const char* name, int age) { 


this-»2goobj = person new((char*)name, age); 
} 
~Person() { 

person_delete(this->goobj_); 
} 


void Set(char* name, int age) { 
person set(this-»goobj , name, age); 


} 


char *ucetName(char s DUF antesaze) st 
return person get name(this-»goobj buf, size); 


} 
int GetAge() { 
return person get age(this-»goobj ); 


包装 后 我 们 就 可 以 像 普通 C++ 类 那样 使 用 了 : 


zinclude "person.h" 
zinclude <stdio.h> 


int main() { 
auto p - new Person("gopher", 10); 


char buf[64]; 
char* name - p-»GetName(buf, sizeof(buf)-1); 


int age = p-»GetAge(); 


printf("96s, 96d years old.*n", name, age); 
delete p; 


return 0; 


H pECTMS A 


在 前 面 的 封装 C++ 对 象 的 实现 中 ， 每 次 通过 new 创 建 一 个 Person 实 例 需 要 进行 两 次 内 存 分 配 : 
一 次 是 针对 C++ 版 本 的 Person， 再 一 次 是 针对 Go 语言 版 本 的 Person。 其 实 C++ 版 本 的 Person 
内 部 只 有 一 个 person_handle t 类 型 的 jd， 用 于 映射 Go 对 象 。 我 们 完全 可 以 将 
person_handle_t 直 接 当 中 C++ 对 象 来 使 用 。 


下 面 时 改进 后 的 包装 方式 : 


extern "C" { 
4include "./person capi.h" 


} 


struct Person { 
static Person* New(const char* name, int age) { 
return (Person*)person new((char*)name, age); 


} 
void Delete() { 
person delete(person handle t(this)); 


} 


void Set(char* name, int age) ( 
person set(person handle t(this), name, age); 


} 
char* GetName(char* buf, int size) { 


return person get name(person handle t(this), buf, size); 


} 
int GetAge() { 
return person get age(person handle t(this)); 
} 
J; 
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中 通过 调用 person_new 来 创建 Person 实 例 ， 返 回 的 是 person handle t 类 型 的 id， 我 们 将 其 

强制 转型 作为 Person* 类 型 指针 返回 。 在 其 它 的 成 员 函 数 中 ， 我 们 通过 将 this 指 针 再 反 向 转型 
为 person handle t 类 型 ， 然 后 通过 C 接 口 调 用 对 应 的 函数 。 


到 此 ， 我 们 就 达到 了 将 Go 对 象 导出 为 C 接 口 ， 然 后 基于 C 接 口 再 包装 为 C++ 对 象 以 便于 使 用 的 
目的 。 


彻底 解放 C++ 的 this 指 针 


熟悉 Go 语言 的 用 法 会 发 现 Go 语 言 中 方法 是 绑 定 到 类 型 的 。 比 如 我 们 基于 int 定 义 一 个 新 的 Int 类 
型 ， 就 可 以 有 自己 的 方法 : 


type Int int 


func (p Int) Twice() int { 
return int(p)*2 
H 


func main() { 
var x - Int(42) 
fmt.Println(int(x)) 
fmt.Println(x.Twice()) 


这 样 就 可 以 在 不 改变 原 有 数据 底层 内 存 结构 的 前 提 下 ， 自 由 切换 int 和 Int 类 型 来 使 用 变量 。 


而 在 C++ 中 要 实现 类 似 的 特性 ， 一 般 会 采用 以 下 实现 : 


class Int ( 
int v ; 


Int(v int) { this.v = v; } 
nt Twice() Const return thys.v-*2; 


HN 


int main() { 
Int v(42); 


printi (vd Nn vr 7 error 
printf ("%d\n", v.Twice()); 


新 包装 后 的 Int 类 虽然 增加 了 Twice 方 法 ， 但 是 失去 了 自由 转 回 int 类 型 的 权利 。 这 时 候 不 仅 连 
printf 都 无 法 输出 Int 本 身 的 值 ， 而且 也 失去 了 int 类 型 运算 的 所 有 特性 。 这 就 是 C++ 构 造 函 数 的 
ARE AR: 以 失去 原 有 的 一 切 特 性 的 代价 换取 class 的 施舍 。 


造成 这 个 问题 的 根源 是 C++ 中 this 被 国定 为 class 的 指针 类 型 了 。 我 们 重新 回顾 下 this 在 Go 语言 
中 的 本 质 : 


func (this Int) Twice() int 
func Int Twice(this Int) int 


在 Go 语言 中 ， 和 this 有 着 相似 功能 的 类 型 接收 者 参数 其 实 只 是 一 个 普通 的 函数 参数 ， 我 们 可 以 
自由 选择 值 或 指针 类 型 。 
如 果 以 C 语 言 的 角度 来 思考 ，this 也 只 是 一 个 普通 的 void* 类 型 的 指针 ， 我 们 可 以 随意 自由 地 
将 this 转 换 为 其 它 类 型 。 


struct Int ( 
int Twice() ( 
const int* p - (int*)(this); 
return (*p) * 2; 


} 
}; 
int main() 1 
Ine X = A2; 
printf("96dNn", x); 
printf ("%d\n", ((Int*)(&x))-»Twice()); 
return 0; 
} 


这 样 我 们 就 可 以 通过 将 int 类 型 指针 强制 转 为 Int 类 型 指针 ， 代 替 通 过 默认 的 构造 函数 后 new 来 
构造 Int 对 象 。 在 Twice 函 数 的 内 部 ， 以 相反 的 操作 将 this 指 针 转 回 int 类 型 的 指针 ， 就 可 以 解析 
出 原 有 的 int 类 型 的 值 了 。 这 时 候 Int 类 型 只 是 编译 时 的 一 个 党 子 ， 并 不 会 在 运行 时 占用 额外 的 


空间 。 


因此 C++ 的 方法 其 实 也 可 以 用 于 普通 非 class 类 型 ，C++ 到 普通 成 员 函 数 其 实 也 是 可 以 绑 定 到 
类 型 的 。 只 有 纯 虚 方法 是 绑 定 到 对 象 ， 那 就 是 接口 。 


2. 9. 静态 库 和 动态 Gs Je 


CGO 在 使 用 C/C++ 资源 的 时 候 一 般 有 三 种 形式 : 直接 使 用 源码 ; 链接 静态 库 ; 链接 动态 库 。 
直接 使 用 源码 就 是 在 import "C" 之 前 的 注释 部 分 包含 C 代 码 ， 或 者 在 当前 包 中 包含 C/C++ 源 
文件 。 链 接 静 态 库 和 动态 库 的 方式 比较 类 似 ， 都 是 通过 在 LDFLAGS 选 项 指定 要 链接 的 库 方式 
链接 。 本 节 我 们 主要 关注 在 CGO 中 如 何 使 用 静态 库 和 动态 库 相关 的 问题 。 


Iž ACH SE 


如 果 CGO 中 引入 的 C/C++ 资 源 有 代码 而 且 代码 规模 也 比较 小 ， 直 接 使 用 源码 是 最 理想 的 方 
式 ， 但 很 多 时 候 我 们 并 没有 源 代码 ， 或 者 从 C/C++ 源 代码 开始 构建 的 过 程 异常 复杂 ， 这 种 时 候 
使 用 C 静 态 库 也 是 一 个 不 错 的 选择 。 静 态 库 因为 是 静态 链接 ， 最 终 的 目标 程序 并 不 会 产生 额外 
的 运行 时 依赖 ， 也 不 会 出 现 动 态 库 特 有 的 跨 运行 时 资源 管理 的 错误 。 不 过 静态 库 对 链接 阶段 
会 有 一 定 要 求 : 静态 库 一 般 包 含 了 全 部 的 代码 ， 里 面 会 有 大 量 的 符号 ， 如 果 不 同 静态 库 之 间 
出 现 了 符号 冲突 则 会 导致 链接 的 失败 。 


我 们 先 用 纯 C 语 言 构造 一 个 简单 的 静态 库 。 我 们 要 构造 的 静态 库 名 叫 humber， 库 中 只 有 一 个 
number add mod 函数 ， 用 于 表示 数论 中 的 模 加 法 运算 。number 库 的 文件 都 在 number 目 录 
F o 


number/number.h 头 文件 只 有 一 个 纯 C 语 言 风格 的 函数 声明 : 


int number add mod(int a, int b, int mod); 


number/number.c 对 应 函数 的 实现 : 


include "number.h" 


int number add mod(int a, int b, int mod) { 
return (a-b)?smod; 


J 
因为 CGO 使 用 的 是 GCC 命令 来 编译 和 链接 C 和 Go 桥接 的 代码 。 因 此 静态 库 也 必须 是 GCC 兼容 
的 格式 。 
通过 以 下 命令 可 以 生成 一 个 叫 libnumbera 的 静态 库 : 

$ cd ./number 


$ gcc -c -o number.o number.c 
$ ar rcs libnumber.a number.o 


生成 lilbnumber.a 静 态 库 之 后 ， 我 们 就 可 以 在 CGO 中 使 用 该 资源 了 。 


创建 main.go 文 件 如 下 : 


package main 


//itcgo CFLAGS: -I./number 


//itcgo LDFLAGS: -L$(SRCDIR)/number -lnumber 


// 
//tinclude "number.h" 
SOE Ao 


import "fmt" 


func main() { 
fmt.Println(C.number_add_mod(10, 5, 12)) 
j 


其 中 有 两 个 #cgo 命 令 ， 分 别 是 编译 和 链接 参数 。CFLAGS 通 过 -T./number 将 number 库 对 应 
头 文件 所 在 的 目录 加 入 头 文件 检索 路 径 。LDFLAGS 通 过 -L${SRCDIR}/number 将 编译 后 number 
静态 库 所 在 目录 加 为 链接 库 检 索 路 径 ， -lnumber 表示 链接 libnumber.a 静 态 库 。 需 要 注意 的 

是 ， 在 链接 部 分 的 检索 路 径 不 能 使 用 相对 路 径 (C/C++ 代码 的 链接 程序 所 限制 ) ， 我 们 必须 通 
过 cgo 特 有 的 s(sRcpiR) 变量 将 源 文 件 对 应 的 当前 目录 路 径 展开 为 绝对 路 径 (因此 在 windows 
平台 中 绝对 路 径 不 能 有 空白 符号 ) 。 

因为 我 们 有 number 库 的 全 部 代码 ， 所 以 我 们 可 以 用 go generate 工 具 来 生成 静态 库 ， 或 者 是 通 
过 Makefile 来 构建 静态 库 。 因 此 发 布 CGO 源 码 包 时 ， 我 们 并 不 需要 提前 构建 C 静 态 库 。 

因为 多 了 一 个 静态 库 的 构建 步骤 ， 这 种 使 用 了 自 定义 静态 库 并 已 经 包含 了 静态 库 全 部 代码 的 
Go 包 无 法 直接 用 go get 安 装 。 不 过 我 们 依然 可 以 通过 go get 下 载 ， 然 后 用 go generate 触 发 静 
态 库 构 建 ， 最 后 才 是 go install 来 完成 安装 。 

为 了 支持 go get 命 令 直 接 下 载 并 安装 ， 我 们 C 语 言 的 sinclude 语法 可 以 将 number 库 的 源 文件 
链接 到 当前 的 包 。 


创建 z link number c.c 文件 如 下 : 


include "./number/number.c" 


然后 在 执行 go get 或 go build 之 类 命令 的 时 候 ，CGO 就 是 自动 构建 number 库 对 应 的 代码 。 这 
种 技术 是 在 不 改变 静态 库 源 代码 组 织 结构 的 前 提 下 ， 将 静态 库 转 化 为 了 源 代码 方式 引用 。 这 
种 CGO 包 是 最 完美 的 。 


如 果 使 用 的 是 第 三 方 的 静态 库 ， 我 们 需要 先 下 载 安装 静态 库 到 合适 的 位 置 。 然 后 在 #cgo 命 令 


中 通过 CFLAGS 和 LDFLAGS 来 指定 头 文件 和 库 的 位 置 。 对 于 不 同 的 操作 系统 甚至 同一 种 操作 
系统 的 不 同 版 本 来 说 ， 这 些 库 的 安装 路 径 可 能 都 是 不 同 的 ， 那 么 如 何在 代码 中 指定 这 些 可 能 


变化 的 参数 呢 ? 


在 Linux 环 境 ， 有 一 个 pkg-config 命 令 可 以 查询 要 使 用 某 个 静态 库 或 动态 库 时 的 编译 和 链接 参 
数 。 我 们 可 以 在 #cgo 命 令 中 直接 使 用 pkg-config 命 令 来 生成 编译 和 链接 参数 。 而 且 还 可 以 通过 
PKG_CONFIG 环 境 变 量 订 制 pkg-config 命 令 。 因 为 不 同 的 操作 系统 对 pkg-config 命 令 的 支持 不 
尽 相 同 ， 通 过 该 方式 很 难 兼容 不 同 的 操作 系统 下 的 构建 参数 。 不 过 对 于 Linux 等 特定 的 系统 ， 
pkg-config 命 令 确 实 可 以 简化 构建 参数 的 管理 。 关 于 pkg-config 的 使 用 细节 在 此 我 们 不 深入 展 
开 ， 大 家 可 以 自行 参考 相关 文档 。 


使 用 C 动 态 库 


动态 库 出 现 的 初衷 是 对 于 相同 的 库 ， 多 个 进程 可 以 共享 同一 个 ， 以 节省 内 存 和 磁盘 资源 。 但 
是 在 磁盘 和 内 存 已 经 白菜 价 的 今天 ， 这 两 个 作用 已 经 显得 微不足道 了 ， 那 么 除 此 之 外 动态 库 
还 有 哪些 存在 的 价值 呢 ? 从 库 开 发 角度 来 说 ， 动 态 库 可 以 隔离 不 同 动态 库 之 间 的 关系 ， 减 少 
链接 时 出 现 符号 冲突 的 风险 。 而 且 对 于 windows 等 平台 ， 动 态 库 是 跨越 VC 和 GCC 不 同 编译 器 
平台 的 唯一 的 可 行 方式 。 


对 于 CGO 来 说 ， 使 用 动态 库 和 静态 库 是 一 样 的 ， 因 为 动态 库 也 必须 要 有 一 个 小 的 静态 导出 库 
用 于 链接 动态 库 (Linux 下 可 以 直接 链接 so 文件 ， 但 是 在 Windows 下 必须 为 dll 创 建 一 个 .a x 
件 用 于 链接 ) 。 我 们 还 是 以 前 面 的 number 库 为 例 来 说 明 如 何以 动态 库 方式 使 用 。 


对 于 在 macOS 和 [Linux 系 统 下 的 gcc 环 境 ， 我 们 可 以 用 以 下 命令 创建 humber 库 的 的 动态 库 : 


$ cd number 
$ gcc -shared -o libnumber.so number.c 


因为 动态 库 和 静态 库 的 基础 名 称 都 是 libnumber， 只 是 后 级 名 不 同 而 已 。 因 此 Go 语言 部 分 的 代 
码 和 静态 库 版 本 完全 一 样 : 


package main 


//#cgo CFLAGS: -I./number 

//#cgo LDFLAGS: -L${SRCDIR}/number -lnumber 
77. 

//*tinclude "number.h' 

import "C" 

import "fmt" 


func main() { 


fmt.Println(C.number add mod(10, 5, 12)) 
} 


编译 时 GCC 会 自动 找到 libnumber.a 或 libnumber.so 进 行 链接 。 


对 于 windows 平 台 ， 我 们 还 可 以 用 VC 工具 来 生成 动态 库 (windows 下 有 一 些 复 杂 的 C++ 库 只 
能 用 VC 构建 ) 。 我 们 需要 先 为 number.dll 创 建 一 个 def 文 件 ， 用 于 控制 要 导出 到 动态 库 的 符 


ua 


X o 

number.def 文 件 的 内 容 如 下 : 
LIBRARY number.dll 
EXPORTS 


number add mod 


其 中 第 一 行 的 LIBRARY 指 明 动 态 库 的 文件 名 ， 然 后 的 EXPORTS 语 句 之 后 是 要 导出 的 符号 名 
列表 o 


现在 我 们 可 以 用 以 下 命令 来 创建 动态 库 (需要 进入 VC 对 应 的 x64 命 令 行 环境 ) 。 


$ cl /c number.c 
$ link /DLL /OUT:number.dll number.obj number.def 


这 时 候 会 为 由 同时 生成 一 个 numberlib 的 导出 库 。 但 是 在 CGO 中 我 们 无 法 使 用 lib 格 式 的 链接 
库 o 


要 生成 .a 格式 的 导出 库 需 要 通过 mingw 工 具 箱 中 的 dlltool 命 令 完 成 : 


$ dlltool -dllname number.dll --def number.def --output-lib libnumber.a 


生成 了 libnumber.a 文 件 之 后 ， 就 可 以 通过 -1number 链接 参数 进行 链接 了 o 


需要 注意 的 是 ， 在 运行 时 需要 将 动态 库 放 到 系统 能 够 找到 的 位 置 。 对 于 windows 来 说 ， 可 以 将 
动态 库 和 可 执行 程序 放 到 同一 个 目录 ， 或 者 将 动态 库 所 在 的 目录 绝对 路 径 添加 到 PATH 环境 变 
量 中 。 对 于 macOS 来 说 ， 需 要 设置 DYLD_LIBRARY_PATH 环 境 变 量 。 而 对 于 Linux 系 统 来 

说 ， 需 要 设置 LD_LIBRARY_PATH 环 境 变 量 。 


导出 C 静 态 库 


CGO 不 仅 可 以 使 用 C 静 态 库 ， 也 可 以 将 Go 实现 的 函数 导出 为 C 静 态 库 。 我 们 现在 用 Go 实现 前 
面 的 number 库 的 模 加 法 郊 数 。 


创建 numbergo， 内 容 如 下 : 


package main 

Import ee 

func main() {} 

//export number_add_mod 

func number_add_mod(a, b, mod C.int) C.int { 


return (a + b) % mod 


} 


TRAE CGO x 45 85 3E. ^ RNE X E main & P RCRA o SET CAR UE E Zr CR G^ 会 忽略 
main 包 中 的 main 函 数 ， 只 是 简单 导出 C 函 数 。 采 用 以 下 命令 构建 : 


$ go build -buildmode-c-archive -o number.a 


在 生成 number.a 静 态 库 的 同时 ，cgo 还 会 生成 一 个 number.h 文 件 。 


number.h 文 件 的 内 容 如 下 (为 了 便于 显示 ， 内 容 做 了 精简 ) 


#ifdef __cplusplus 
extern "c" T 
#endif 


extern int number add mod(int pO, int pi, int p2); 
Zzifdef _ cplusplus 


} 


#endif 


其 中 extern "c" 部 分 的 语法 是 为 了 同时 适 配 C 和 C++ 两 种 语言 。 核 心 内 容 是 声明 了 要 导出 的 
number add mod;&Z ° 

然后 我 们 创建 一 个 test main.c 的 C 文 件 用 于 测试 生成 的 C 静 态 库 〈 用 下 划 线 作为 前 组 名 是 让 
为 了 让 go build 构 建 C 静 态 库 时 忽略 这 个 文件 ) 


include "number.h" 


include <stdio.h> 


int main() 1 
int a = 10; 
ambe eS si 
ne G = 


int x = number_add_mod(a, b, c); 
printf("(%d+%d)%%%d = %d\n", a, b, c, x); 


return 0; 


$ gcc -o a.out test main.c number.a 
$ ./a.out 


使 用 CGO 创建 静态 库 的 过 程 非 常 简单 。 


导出 C 动 态 库 


CGO 导 出 动态 库 的 过 程 和 静态 库 类 似 ， 只 是 将 构建 模式 改 为 c-shared ， 输 出 文件 名 改 
为 number.so 而 已 : 


$ go build -buildmode=c-shared -o number.so 
.test main.c 文件 内 容 不 变 ， 然 后 用 以 下 命令 编译 并 运行 : 


$ gcc -o a.out test main.c number.so 
$ ./a.out 


导出 非 main 包 的 函数 


通过 go help buildmode 命令 可 以 查看 C 静 态 库 和 C 动 态 库 的 构建 说 明 : 


-buildmodezc-archive 
Build the listed main package, plus all packages it imports, 
into a C archive file. The only callable symbols will be those 
functions exported using a cgo //export comment. Requires 
exactly one main package to be listed. 


-buildmode-c-shared 
Build the listed main package, plus all packages it imports, 
into a C shared library. The only callable symbols will 
be those functions exported using a cgo //export comment. 
Requires exactly one main package to be listed. 


文档 说 明 导 出 的 C 函 数 必 须 是 在 main 包 导出 ， 然 后 才能 在 生成 的 头 文件 包含 声明 的 语 匈 。 但 是 
很 多 时 候 我 们 可 能 更 希望 将 不 同类 型 的 导出 函数 组 织 到 不 同 的 Go 包 中 ， 然 后 统一 导出 为 一 个 
静态 库 或 动态 库 


要 实现 从 是 从 非 main 包 导出 C 函 数 ， 或 者 是 多 个 包 导 出 C 函 数 (因为 只 能 有 一 个 main 包 ) » X 
们 需要 自己 提供 导出 C 函 数 对 应 的 头 文件 es 的 导出 函数 生成 头 文 
件 ) 。 


假设 我 们 先 创建 一 个 number 子 包 ， 用 于 提供 模 加 法 函数 : 


package number 
zum Ot C 
//export number add mod 


func number add mod(a, b, mod C.int) C.int { 
return (a * b) 9?6 mod 


然后 是 当前 的 main 包 : 


package main 
zm Ote C 


import ( 
Eme 


— ",/number" 


func main() { 
println("Done") 


//export goPrintln 
func goPrintln(s *C.char) { 
fmt.Println("goPrintin:", C.GoString(s)) 


其 中 我 们 导入 了 number 子 包 ， number f & P A 5 H 49C% Ztnumber. add. mod > FLA AX] 
在 main 包 也 导出 了 goPrintln $% žk » 


通过 以 下 命令 创建 C 静 态 库 : 


$ go build -buildmode-c-archive -0 main.a 


这 时 候 在 生成 main.a 静 态 库 的 同时 ， 也 会 生成 一 个 main.h 头 文件 。 但 是 main.h 头 文件 中 只 有 
main 包 中 导出 的 goPrintIn 鸭 数 的 声明 ， 并 没有 number 子 包 导 出 函数 的 声明 。 其 实 
number_add_mod 函 数 在 生成 的 C 静 态 库 中 是 存在 的 ， 我 们 可 以 直接 使 用 。 


创建 test main.c 测试 文件 如 下 : 


include <stdio.h> 


void goPrintln(char*); 
int number add mod(int a, int b, int mod); 


int main() 1 


int a = T10; 
ine b = 5; 
inte e = 12; 


int x = number_add_mod(a, b, c); 
printf("(%d+%d)%%%d = %d\n", a, b, c, X); 


goPrintln("done"); 
return OQ; 


我 们 并 没有 包含 CGO 自动 生成 的 main.h 头 文件 ， 而 是 通过 手工 方式 声明 了 goPrintln 和 
number_add_mod 两 个 导出 函数 。 这 样 我 们 就 实现 了 从 多 个 Go 包 寻 出 C 函 数 了 。 


2.10 Go 实现 Python 模块 


前 面 章 节 我 们 已 经 讲述 了 如 何 通 过 CGO 来 引用 和 创建 C 动 态 库 和 静态 库 。 实 现 了 对 C 动 态 库 和 
静态 库 的 支持 ， 理 论 上 就 可 以 应 用 到 动态 库 的 绝 大 部 分 场景 。Python 语 言 作 为 当下 最 红 的 语 
言 ， 本 节 我 们 将 演示 如 何 通过 Go 语言 来 为 Python 脚本 语言 编写 扩展 模块 。 


基于 ctypes 


Python 内 置 了 非常 丰富 的 模块 ， 其 中 ctypes 支 持 直 接 从 C 动 态 库 调 用 函数 。 为 了 演示 如 何 基于 
ctypes 技 术 来 扩展 模块 ， 我 们 需要 先 用 Go 语言 创建 一 个 C 动 态 库 。 


我 们 使 用 的 是 之 前 出 现 过 的 例子 : 


/ main.go 


package main 


zm Ot C 
import "fmt" 


func main() (3 


//export SayHello 
func SayHello(name *C.char) { 
fmt.Printf("hello %s!\n", C.GoString(name)) 


} 


其 中 只 导出 了 一 个 SayHello 函 数 ， 用 于 打印 字符 串 。 通 过 以 下 命令 基于 上 述 Go 代码 创建 say- 
hello.so 动 态 库 : 


Li 


go build -buildmode-zc-shared -o say-hello.so main.go 


现在 我 们 就 可 以 通过 ctypes 模 块 调 用 Say-hello.so 动 态 库 中 的 SayHello 函 数 了 : 


// hello.py 
import ctypes 


libso - ctypes.CDLL("./say-hello.so") 


SayHello - libso.SayHello 
SayHello.argtypes - [ctypes.c char p] 
SayHello.restype - None 


SayHello(ctypes.c char p(b'"hello")) 


我 们 首先 通过 ctypes.CDLL 加 载 动态 库 到 libso， 并 通过 libso.SayHello 来 获取 SayHello 有 函数 。 
获取 到 SayHello 有 函数 之 后 设置 函数 的 输入 参数 为 一 个 C 语 言 类 型 的 字符 串 ， 该 函数 没有 返回 
值 。 然 后 我 们 通过 ctypes.c char p(b"hello") 将 Python 字 节 串 转 为 C 语 言 格 式 的 字符 串 作为 
参数 调用 SayHello。 如 果 一 切 正常 的 话 就 可 以 输出 字符 串 了 。 


从 这 个 例子 可 以 看 出 ， 给 予 ctypes 构 造 Python 扩展 模块 非常 简单 ， 本 质 上 只 是 在 构建 一 个 纯 C 
语言 规格 的 动态 库 。 比 较 复 杂 的 部 分 在 ctypes 的 具体 使 用 ， 关 于 ctypes 的 具体 细节 就 不 详细 展 
开 的 ， 用 户 可 以 自行 参考 Python 自 带 的 官方 文档 。 


基于 Python C 接 口 创建 


在 前 面 的 例子 中 ， 通 过 ctypes 创 建 的 模块 必须 要 用 Python 再 包装 一 层 ， 否 则 就 要 直接 面 对 C 语 
言 风格 的 接口 。 如 果 基 于 基于 Python C 接 口 ， 我 们 可 以 完全 再 Go 和 C 语 言 层面 创建 灵活 强大 
的 模块 ， 重 点 是 不 再 需要 在 Python 中 重新 包装 。 


基于 Python C 接 口 创 建 模块 和 使 用 C 语 言 的 静态 库 的 流程 类 似 : 


package main 


F oi 
// macOS: 
#cgo darwin pkg-config: python3 


// linux 
#cgo linux pkg-config: python3 


// windows 
// should generate libpython3.a from python3.lib 


#define Py_LIMITED_API 
#include <Python.h> 


extern PyObject* PyInit gopkg(); 
extern PyObject* Py gopkg sum(PyObject *, PyObject *); 


static int cgo PyArg ParseTuple ii(PyObject *arg, int *a, int *b) { 
return PyArg ParseTuple(arg, "ii", a, b); 


static PyObject* cgo PyInit gopkg(void) { 

static PyMethodDef methods[] = { 
("sum", Py gopkg sum, METH VARARGS, "Add two numbers."), 
(NULL, NULL, ©, NULL), 

}; 

static struct PyModuleDef module = ( 
PyModuleDef HEAD INIT, "gopkg", NULL, -1, methods, 

}; 

return PyModule Create(&module); 


n 
import "c" 


func main() (3 


//export PyInit gopkg 
func PyInit gopkg() *C.PyObject { 
return C.cgo PyInit gopkg() 


//export Py gopkg sum 
func Py gopkg sum(self, args *C.PyObject) *C.PyObject { 
var a, b C.int 
if C.cgo PyArg ParseTuple ii(args, &a, &b) == 0 ( 
return nil 


H 
return C.PyLong FromLong(C.long(a -* b)) 


为 Python 的 链接 参数 要 复杂 了 很 多 ， 我 们 借助 pkg-config 工 具 来 获取 编译 参数 和 链接 参数 。 
然后 我 们 在 Go 语言 中 分 别 导 出 了 Pylnit gopkgfePy gopkg sum;i&Zt > X-PPylnit gopkg % žk 
用 于 初始 化 名 为 gopkg 的 Python 模 块 ， 而 Py_gopkg_sum 郊 数 则 是 模块 中 sum 方 法 的 实现 。 


因此 PyArg_ParseTuple 是 可 变 参 数 类 型 ，CGO 中 无 法 使 用 可 变 参 数 的 C 函 数 ， 因 此 我 们 通过 
增加 一 个 cgo_PyArg_ParseTuple ii 辅助 函数 小 消除 可 变 参数 的 影响 。 同 样 ， 模 块 的 方法 列表 
必须 在 C 语 言 内 存 空间 创建 ， 因 为 CGO 是 禁止 将 Go 语言 内 存 直接 返回 到 C 语 言 空 间 的 。 


然后 通过 以 下 命令 创建 gopkg.so 动 态 库 : 


go build -buildmode=c-shared -o gopkg.so main.go 


这 里 需要 注意 几 个 出 现 gopkg 名 字 的 地 方 。gopkg 是 我 们 创建 的 Python 模块 的 名 字 ， 因 此 它 对 
应 一 个 gopkg.so 动 态 库 。 再 gopkg.so 动 态 库 中 必须 有 一 个 Pylnit gopkg 函 数 ， 该 函数 是 模块 的 
初始 化 函数 。 在 Pylnit_ gopkg 有 函数 初始 化 模块 时 ， 同 样 需要 指定 模块 的 名 字 时 gopkg。 模 块 中 
的 方法 函数 是 通过 函数 指针 访问 ， 具 体 的 名 字 没 有 影响 。 


macOS 环 境 构建 


为 在 macOS 中 ，pkg-config 不 支持 Python3 版 本 。 不 过 macOS 有 一 个 python3-config 的 命令 
可 以 实现 pkg-config 类 似 的 功能 。 不 过 python3-config 生 成 的 编译 参数 无 法 直接 用 于 CGO 编译 
选项 〈 因 为 GCC 不 能 识别 部 分 参数 会 导致 错误 构建 ) 。 


我 们 在 python3-config 的 基础 只 是 又 包装 了 一 个 工具 ， 在 通过 python3-config 获 取 到 编译 参数 
之 后 将 GCC 不 支持 的 参数 别 除 掉 。 


创建 py3-config.go 文 件 : 


func main() { 


for , s := range os.Args { 
if s == "--cflags" { 
out, _ := exec.Command("python3-config", "--cflags").CombinedOutput() 


out = bytes.Replace(out, []byte("-arch"), []byte{}, -1) 
out = bytes.Replace(out, []byte("i386"), []byte{}, -1) 
out = bytes.Replace(out, []byte("x86 64"), []byte(j, -1) 
fmt.Print(string(out)) 


return 
} 
if s == "--libs" { 
out, _ := exec.Command("python3-config", "--l1dflags").CombinedOutput() 
fmt.Print(string(out)) 
return 
} 


cgo 中 的 pkg-config 只 需要 两 个 参数 --cflags 和 --libs 。 其 中 --libs 选项 的 输出 我 们 采用 的 
是 python3-config --ldflags 的 输出 ， 因 为 --libs 选项 没有 包含 库 的 检索 路 径 ”而 -- 
ldflags 选项 则 是 在 指定 链接 库 参 数 的 基础 上 增加 了 库 的 检索 路 径 。 


基于 py3-config.go 可 以 创建 一 个 py3-config 命 令 。 然 后 通过 PKG_CONFIG 环 境 变量 将 cgo 使 用 
的 pkg-config 命 令 指 定 为 我 们 订 制 的 命令 : 


PKG CONFIG-./py3-config go build -buildmode-c-shared -o gopkg.so main.go 


对 于 不 支持 pkg-config 的 平台 我 们 都 可 以 基于 类 似 的 方法 处 理 。 


2.11. 编译 和 链接 参数 


编译 和 链接 参数 是 每 一 个 C/C++ 程序 员 需 要 经 常 面 对 的 问题 。 构 建 每 一 个 C/C++ 应 用 均 需 要 经 
过 编译 和 链接 两 个 步 又，CGO 也 是 如 此 。 本 节 我 们 将 简要 讨论 CGO 中 经 常用 到 的 编译 和 链接 
参数 的 用 法 。 


编译 参数 : CFLAGS/CPPFLAGS/CXXFLAGS 


编译 参数 主要 是 头 文件 的 检索 路 径 ， 预 定义 的 宏 等 参数 。 理 论 上 来 说 C 和 C++ 是 完全 独立 的 两 
个 编程 语言 ， 它 们 可 以 有 着 自己 独立 的 编译 参数 。 但 是 因为 C++ 语言 对 C 语 言 做 了 深度 兼容 ， 
甚至 可 以 将 C++ 理解 为 C 语 言 的 超 集 ， 因 此 C 和 C++ 语言 之 间 又 会 共享 很 多 编译 参数 。 因此 
CGO 提供 了 CFLAGS/CPPFLAGS/CXXFLAGS 三 种 参数 ， 其 中 CFLAGS 对 应 C 语 言 编 译 参 数 
(以 .c 后 级 名 )、CPPFLAGS 对 应 C/C++ 代码 编译 参数 (.c.cc,.cpp,.CXX)、CXXFLAGS 对 应 纯 
C++ 编译 参数 (.cc,.cpp,*.CXX)。 


链接 参数 : LDFLAGS 


链接 参数 主要 包含 要 链接 库 的 检索 目录 和 要 链接 库 的 名 字 。 因 为 历史 遗留 问题 ， 链 接 库 不 支 
持 相 对 路 径 ， 我 们 必须 为 链接 库 指 定 绝 对 路 径 。cgo 中 的 $(SRCDIR) 为 当前 目录 的 绝对 路 
径 。 经 过 编译 后 的 C 和 C++ 目标 文件 格式 是 一 样 的 ， 因 此 LDFLAGS 对 应 C/C++ 共 同 的 链接 参 
数 。 


pkg-config 


为 不 同 C/C++ 库 提供 编译 和 链接 参数 是 一 项 非常 繁琐 的 工作 ， 因 此 cgo 提 供 了 对 应 pkg- 
config 工具 的 支持 。 我 们 可 以 通过 #cgo pkg-config xxx 命令 来 生成 XXX 库 需要 的 编译 和 链接 
参数 ， 其 底层 通过 调用 pkg-config xxx --cflags 生成 编译 参数 ， 通 过 pkg-config xxx -- 
libs 命令 生成 链接 参数 。 需要 注意 的 是 pkg-config 工具 生成 的 编译 和 链接 参数 是 C/C++ 公用 
的 ， 无 法 做 更 细 的 区 分 。 


pkg-config 工具 虽然 方便 ， 但 是 有 很 多 非 标准 的 C/C++ 库 并 没有 实现 对 其 支持 。 这 时 候 我 们 
可 以 手工 为 pkg-config 工具 创建 对 应 库 的 编译 和 链接 参数 实现 支持 。 


比如 有 一 个 名 为 XXX 的 C/C++ 库 ， 我 们 可 以 手工 创建 /usr/1ocal/lib/pkgconfig/xxx.bc 文件 : 


Name: xxx 
Cflags:-I/usr/local/include 
Libs:-L/usr/local/lib -lxxx2 


其 中 Name 是 库 的 名 字 ，Cflags 和 Libs 行 分 别 对 应 XXX 使 用 库 需 要 的 编译 和 链接 参数 。 如 果 bc 文 
件 在 其 它 目 录 ， 可 以 通过 PKG_CONFIG_PATH 环 境 变量 指定 pkg-config 工具 的 检索 目录 。 


而 对 应 cgo 来 说 ， 我 们 甚至 可 以 通过 PKG_CONFIG 环境 变量 可 指定 自 定 义 的 pkg-config 程 
序 。 如 果 是 自己 实现 CGO 专用 的 pkg-config 程 序 ， 只 要 处 理 - -cflags 和 --libs 两 个 参数 即 
"po 


下 面 的 程序 是 macos 系 统 下 生成 Python3 的 编译 和 链接 参数 : 


// py3-config.go 
func main() { 


for , s := range os.Args { 
if s -- "--cflags" ( 
out, _ := exec.Command("python3-config", "--cflags").CombinedOutput() 


out = bytes.Replace(out, []byte("-arch"), []byte{}, -1) 
out = bytes.Replace(out, []byte("i386"), []byte{}, -1) 
out = bytes.Replace(out, []byte("x86 64"), []byte(j, -1) 
fmt.Print(string(out)) 


return 
} 
if s == "--libs" { 
out, _ := exec.Command("python3-config", "--ldflags").CombinedOutput() 
fmt.Print(string(out)) 
return 
J 


然后 通过 以 下 命令 构建 并 使 用 自 定 义 的 pkg-config 工具 : 


$ go build -o py3-config py3-config.go 
$ PKG CONFIG-./py3-config go build -buildmode-c-shared -o gopkg.so main.go 


具体 的 细节 可 以 参考 Go 实现 Python 模块 章节 。 


go get 链 


在 使 用 go get 获取 Go 语言 包 的 同时 会 获取 包 依 赖 的 包 。 比 如 A 包 依赖 B 包 ，B 包 依赖 C 包 ，C 
包 依 赖 D 包 : pkgA -> pkgB -> pkgc -> pkgD -> ... ° go get 获 取 A 包 之 后 会 依次 线 获取 
BCD 包 。 如 果 在 获取 B 包 之 后 构建 失败 ， 那 么 将 导致 链条 的 断裂 ， 从 而 导致 A 包 的 构建 失败 。 


链条 断裂 的 原因 有 很 多 ， 其 中 常见 的 原因 有 : 


e 不 支持 某 些 系统 , 编译 失败 

e 依赖 cgo, 用 户 没 有 安装 gcc 

e 依赖 cgo, 但 是 依赖 的 库 没 有 安装 

e 依赖 pkg-config, windows 上 没有 安装 

e 依赖 pkg-config, 没有 找到 对 应 的 bc 文件 
e 依赖 自 定 义 的 pkg-config, 需要 额外 的 配置 
。 依赖 swig, 用 户 没有 安装 swig, 或 版 本 不 对 


仔细 分 析 可 以 发 现 ， 失 败 的 原因 中 和 CGO 相关 的 问题 占 了 绝 大 多 数 。 这 并 不 是 偶然 现象 ， 自 
动 化 构建 C/C++ 代码 一 直 是 一 个 世界 难题 ， 到 目前 位 置 也 没有 出 现 一 个 大 家 认可 的 统一 的 
C/C++ 管理 工具 。 


为 用 了 cgo， 比 如 gcc 等 构建 工具 是 必须 安装 的 ， 同 时 尽量 要 做 到 对 主流 系统 的 支持 。 如果 
依赖 的 C/C++ 包 比较 小 并 且 有 源 代码 的 前 提 下 ， 可 以 优先 选择 从 代码 构建 。 


比如 github.com/chai2010/webp 包 通 过 为 每 个 C/C++ 源 文件 在 当前 包 建 立 关键 文件 实现 零 配置 
依赖 : 


// z libwebp src dec alpha.c 
4include "./internal/libwebp/src/dec/alpha.c" 


因此 在 编译 z libwebp src dec alpha.c 文件 时 ， 会 编译 libweb 原 生 的 代码 。 其 中 的 依赖 是 相 
对 目录 ， 对 于 不 同 的 平台 支持 可 以 保持 最 大 的 一 致 性 。 
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因为 导出 后 的 Go 元 数 就 可 以 当 作 C 遂 数 使 用 ， 所 以 必须 有 效 。 但 是 不 同 包 导出 的 Go 元 数 将 在 
同一 个 全 局 的 名 字 空 间 ， 因 此 需要 小 心 避 免 重 名 的 问题 。 如 果 是 从 不 同 的 包 寻 出 Go 函数 到 C 
语言 空间 ， 那 么 cgo 自 动 生 成 的 _cgo_export.h 文件 将 无 法 包含 全 部 到 处 的 函数 声明 ， 我 们 必 
须 通 过 手写 头 文 件 的 方式 什么 导出 的 全 部 函数 。 


2.12. t JL 358] 


为 何 要 话费 巨大 的 精力 学 习 CGO 是 一 个 问题 。 任 何 技术 和 语言 都 有 它 自身 的 优点 和 不 足 ，Go 
语言 不 是 银 弹 ， 它 无 法 解决 全 部 问题 。 而 通过 CGO 可 以 继承 C/C++ 将 近 半 个 世纪 的 软件 遗 

产 ， 通 过 CGO 可 以 用 Go 给 其 它 系统 写 C 接 口 的 共享 库 ， 通 过 CGO 技术 可 以 让 Go 语言 编写 的 
代码 可 以 很 好 地 融入 现 有 的 软件 生态 一 一 而 现在 的 软件 正式 建立 在 C/C++ 语言 之 上 的 。 因 此 说 
CGO 是 一 个 保底 的 后 备 技术 ， 它 是 Go 的 一 个 重量 级 的 蔡 补 技术 ， 值 得 任何 一 个 严肃 的 Go 语 
言 开 发 人 员 学 习 。 


本 章 讨 论 了 CGO 的 一 些 常见 用 法 ， 并 给 出 相关 的 例子 。 关 于 CGO 有 几 点 补充 : 如 果 有 纯 Go 的 
解决 方法 就 不 要 使 用 CGO ; CGO 中 涉及 的 C 和 C++ 构建 问题 非常 繁琐 ; CGO 有 一 定 的 限制 无 
法 实现 解决 全 部 的 问题 ; 不 要 试图 越过 CGO 的 一 些 限 制 。 而 有 全 CGO 只 是 一 种 官方 提供 并 推荐 
的 Go 语言 和 CI/C++ 交 互 的 方法 。 如 果 是 使 用 的 gccgo 的 版 本 ， 可 以 通过 gccgo 的 方式 实现 Go 和 
C/C++ 的 交互 。 同 时 SWIG 也 是 一 种 选择 ， 并 对 C++ 诸 多 特性 提供 了 支持 。 


第 三 和 草 Go 汇编 语言 


Go 语言 中 很 多 设计 思想 和 工具 都 是 传承 自 Plan9 操 作 系统 ，Go 汇 编 语 言 也 是 基于 Plan9 汇 编 演 
化 而 来 。 根 据 Rob Pike 的 介绍 ， 大 神 Ken Thompson 在 1986 年 为 Plan9 系 统 编 写 的 C 语 言 编 译 
器 输出 的 汇编 伪 代 码 就 是 Plan9 汇 编 的 前 身 。 所 谓 的 Plan9 汇 编 语 言 只 是 便于 以 手工 方式 书写 
该 C 语 言 编译 器 输出 的 汇编 伪 代 码 而 已 。 


无 论 高 级 语言 如 何 发 展 ， 作 为 最 接近 CPU 的 汇编 语言 的 地 方 依然 是 无 法 彻底 被 蔡 代 的 。 只 有 
通过 汇编 语言 才能 彻底 挖掘 CPU 芯 片 的 全 部 功能 ， 因 此 操作 系统 的 引导 过 程 必须 要 依赖 汇编 
语言 的 帮助 。 只 有 通过 汇编 语言 才能 彻底 榨 干 CPU 世 片 的 性 能 ， 因 此 很 多 底层 的 加 密 解 密 等 
对 性 能 敏感 的 算法 会 考虑 通过 汇编 语言 进行 性 能 优化 。 


对 于 每 一 个 严肃 的 Gopher ，Go 汇 编 语言 都 是 一 个 不 可 忽视 的 技术 。 因 为 哪怕 只 懂 一 点 点 汇 
编 ， 也 便于 更 好 地 理解 计算 机 ， 将 更 容易 理解 Go 语言 中 动态 栈 /接口 等 高 级 特性 的 实现 原理 。 
而 且 掌 握 了 Go 汇编 语言 之 后 ， 你 将 不 用 担心 再 被 其 它 所 谓 的 任何 高 级 编程 语言 用 户 部 视 。 


本 章 我 们 将 以 AMD64 为 主要 开发 环境 ， 简 单 地 探讨 Go 汇编 语言 的 基础 用 法 。 


3.1. 快速 入 门 


在 第 一 章 的 “Hello, World 的 革命 "一 节 中 ， 我 们 已 经 见 过 一 个 Go 汇编 程序 。 本 节 我 们 将 通过 分 
析 简 单 的 Go 程序 输出 的 汇编 代码 ， 然 后 照 猫 画 虎 用 汇编 实现 一 个 简单 的 输出 程序 。 


实现 和 声明 


Go 汇编 语言 并 不 是 一 个 独立 的 语言 ， 主 要 原因 是 因为 Go 汇编 程序 无 法 独立 使 用 。Go 汇 编 代 
码 必 须 以 Go 包 的 方式 被 组 织 ， 同 时 包 中 至 少 要 有 一 个 Go 语言 文件 。 如 果 Go 汇 编 代 码 中 定义 
的 变量 和 函数 要 被 其 它 Go 语言 代码 引用 ， 还 需要 通过 Go 语言 代码 将 汇编 中 定义 的 符号 声明 出 
来 。 用 于 变量 的 定义 和 函数 的 定义 Go 汇编 文件 类 似 于 C 语 言 中 的 .c 文 件 。 而 用 于 导出 汇编 中 定 
义 符号 的 Go 源 文 件 类 似 于 C 语 言 的 .h 文 件 。 


> y 3. R B-A 
定义 整数 变量 
为 了 简单 ， 我 们 先 用 Go 语言 定义 并 赋值 一 个 整数 变量 ， 然 后 查看 生成 的 汇编 代码 。 


创建 pkg.go 文 件 ， 内 容 如 下 : 


package pkg 


var Id = 9527 


然后 用 以 下 命令 查看 的 Go 语言 程序 对 应 的 伪 汇 编 代 码 : 


$ go tool compile -S pkg.go 
"",Id SNOPTRDATA size-8 
0x0000 37 25 00 00 00 00 00 00 i 


输出 的 汇编 比较 简单 ， 其 中 d 对 应 Id 变量 符号 ， 变 量 的 内 存 大 小 为 8 个 字 节 。 变 量 的 初始 
化 内 容 为 37 25 00 00 00 00 00 00 ， 对 应 十 六 进 制 格 式 的 0x2537， 对 应 十 进 制 为 9527。 
SNOPTRDATA 是 相关 的 标志 ， 暂 时 忽略 。 

以 上 的 内 容 只 是 目标 文件 对 于 的 汇编 ， 和 Go 汇编 语言 虽然 相似 当 并 不 完全 等 价 。Go 语 言 官 网 
自 带 了 一 个 Go 汇编 语言 的 入 门 教程 ， 地 址 在 : https;//golang.org/doc/asm ° 


Go 汇编 语言 提供 了 DATA 命 令 用 于 初始 化 变量 ，DATA 命 令 的 语法 如 下 : 


DATA symbol-*offset(SB)/width, value 


XT symbol 变量 在 汇编 语言 中 对 应 的 符号 , offset 是 符号 开始 地 址 的 偏 移 量 width 是 要 初始 
化 内 存 的 宽度 大 小 ，value 是 要 初始 化 的 那天 。 其 中 当前 包 中 Go 语言 定义 的 符号 symbol， 在 江 
编 代 码 中 对 应 ,symbol ， 其 中 :为 一 个 特殊 的 unicode 符 号 。 


采用 以 下 命令 可 以 给 ld 变量 初始 化 为 十 六 进 制 的 0x2537， 对 应 十 进 制 的 9527， 常 量 需要 以 美 
元 符号 $ 开 头 表示 : 


DATA :Id+0(SB)/1,$0x37 
DATA .Id+1(SB)/1,$0x25 


hd 


定义 好 之 后 需要 导出 以 共 其 它 代 码 引 用 。Go 汇 编 语言 提供 了 GLOBL 命 令 用 于 将 符号 导 
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GLOBL symbol(SB), width 


其 中 symbol 对 应 汇编 中 符号 的 名 字 ，width 为 符号 对 应 内 存 的 大 小 。 用 以 下 命令 将 汇编 中 的 :ld 
变量 导出 : 


GLOBL .Id, $8 


现在 已 经 出 版 完成 了 用 汇编 定义 一 个 整数 变量 的 工作 。 


为 了 便于 其 它 包 使 用 该 ld 变量 ， 我 们 还 需要 在 Go 代码 中 声明 该 变量 ， 同 时 也 给 变量 指定 一 个 
合适 的 类 型 。 人 和 修改 pkg.g0 的 内 容 如 下 : 


package pkg 


var Id int 


qu 


表示 声明 一 个 一 个 int 类 型 的 ld 变量 。 因 为 该 变量 已 经 在 汇编 中 定义 ， 因 此 Go 语言 部 分 只 是 声 


明 变 量 ， 声 明 的 变量 不 能 含义 初始 化 的 操作 。 


完整 的 汇编 代码 在 pkg_amd64.s 中 : 


GLOBL -Id(SB),$8 

DATA -:Id«-0(SB)/1, $0x37 
DATA -Id-1(SB)/1,$0x25 
DATA -:Id-2(SB)/1, $0x00 
DATA -Id-3(SB)/1,$0x00 
DATA -:Id-4(SB)/1, $0x00 
DATA -Id-5(SB)/1,$0x00 
DATA -:Id-6(SB)/1, $0x00 
DATA -Id-7(SB)/1,$0x00 


文件 名 pkg_amd64.s 表 示 为 AMD64 环 境 下 的 汇编 代码 文件 。 


虽然 pkg 包 改 用 汇编 实现 ， 但 是 用 法 和 之 前 完全 一 样 : 


package main 
import pkg "pkg 包 的 路 径 " 
func main() { 


println(pkg.Id) 
} 


对 于 GoO 包 的 用 户 来 说 ， 用 Go 汇编 语言 或 GO 语言 实现 并 无 区 别 。 
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定义 字符 串 变 量 

在 前 一 个 例子 中 ， 我 们 通过 汇编 定义 了 一 个 整数 变量 。 现 在 我 们 尝试 通过 汇编 定义 一 个 字符 
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虽然 从 Go 语言 角度 看 ， 定 义 字 符 串 和 整数 变量 的 写法 基本 相同 ， 但 是 字符 串 底 层 却 有 着 比 单 
个 整数 更 复杂 的 数据 结构 。 


创建 pkg.go 文 件 ， 内 容 如 下 : 


package pkg 


var Name = "gopher" 


然后 用 以 下 命令 查看 的 Go 语言 程序 对 应 的 伪 汇 编 代 码 : 


$ go tool compile -S pkg.go 

go.string."gopher" SRODATA dupok size-6 
0x0000 67 6f 70 68 65 72 gopher 

"",Name SDATA size-16 
0x0000 00 00 00 00 OO 00 00 00 06 00 00 00 00 00 00 OO ................ 
rel 0-8 t-1 go.string."gopher"'-*0 


输出 中 出 现 了 一 个 新 的 符号 go.string."gopher"， 根 据 其 长 度 和 内 容 分 析 可 以 猜测 是 对 应 底层 
的 "gopher" 字 符 串 数据 。 因 为 Go 语言 的 字符 串 并 不 是 值 类 型 ，Go 字 符 串 只 是 一 种 只 读 的 引用 
类 型 。 假 设 多 个 代码 中 出 现 了 相同 的 "gopher" 字 符 串 时 ， 程 序 链接 后 其 实 都 是 引用 的 同一 个 符 
号 go.string."gopher"。 因 此 ， 该 符号 有 一 个 SRODATA 标 志 表 示 这 个 数据 在 只 读 内 存 段 ， 
dupok 表 示 出 现 多 个 相同 符号 时 只 保留 一 个 就 可 以 了 。 


而 站 正 的 Go 字符 串 变 量 Name 对 应 的 大 小 却 只 有 16 个 字 节 了 。 其 实 Name 变 量 并 没有 直接 对 
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应 "gopher 字符 串 ， 而 是 对 应 reflect.StringHeader 结 构 体 : 


type reflect.StringHeader struct { 
Data uintptr 
Len int 


从 汇编 角度 看 ，Name 变 量 其 实 对 应 的 是 reflect.StringHeader 结 构 体 类 型 。 前 8 个 字 节 对 应 底 
屋 申 实 字 符 串 数据 的 指针 ， 也 就 是 符号 go.string."gopher" 对 应 的 地 址 。 后 8 个 字 节 对 应 底层 由 
实 字符 串 数据 的 有 效 长 度 ， 这 里 是 6 个 字 节 。 


3 
创建 pkg_amd64.s 文 件 ， 我 们 尝试 通过 汇编 代码 重新 定义 并 初始 化 Name 字 符 串 : 


GLOBL :NameData(SB), $8 
DATA -NameData(SB)/8,$"gopher" 


GLOBL -Name(SB), $16 
DATA -Name-0(SB)/8,$-NameData(SB) 
DATA -Name-8(SB)/8, $6 


因为 在 Go 汇编 语言 中 ，go.string."gopher" 不 是 一 个 合法 的 符号 ， 我 们 无 法 手工 创建 (这 是 给 
编译 器 保留 的 部 分 特权 ， 因 为 手工 创建 类 似 符 号 可 能 打破 编译 器 输出 代码 的 某 些 规 则 ) 。 
此 我 们 新 创建 了 一 个 .NameData 符 号 表示 底层 的 字符 串 数 据 。 

然后 定义 -Name 符 号 为 两 个 16 字 节 ， 其 中 前 8 个 字 节 用 .NameData 符 号 对 应 的 地 址 初始 化 ， 后 
8 个 字 节 为 常量 6 表示 字符 串 长 度 。 


通过 以 下 代码 测试 输出 Name 变 量 : 


package main 
import pkg "pkg 包 的 路 径 " 


func main() { 
printin(pkg.Name) 


在 运行 时 将 会 产生 类 似 以 下 错误 : 


pkgpath.NameData: missing Go //type information for global symbol: size 8 


提示 汇编 中 定义 的 NameData 符 号 没有 类 型 信息 。 其 实 Go 汇 编 语言 中 定义 的 数据 并 没有 所 谓 
的 类 型 ， 每 个 符号 只 不 过 是 对 应 一 个 内 存 而 且 。 出 现 这 种 错误 的 原因 是 ，Go 语 言 的 垃圾 回收 
器 在 打 描 NameData 交 量 的 时 候 ， 无 法 知晓 该 变量 内 部 是 否 包 含 指针 。 因 此 ， 申 正 错 误 的 原因 
并 不 是 NameData 没 有 类 型 ， 二 是 NameData 变 量 没 有 标注 是 否 会 含有 指针 信息 。 


通过 给 NameData 变 量 增加 一 个 标志 ， 表 示 其 中 不 会 包含 指针 数据 可 以 修复 该 错误 : 


zinclude "textflag.h" 


GLOBL :NameData(SB), NOPTR, $8 


通过 给 -NameData 增 加 NOPTR， 表 示 其 中 不 含 指针 数据 。 那 么 垃圾 回收 器 在 遇 到 该 变量 的 时 
候 就 会 停止 内 部 数据 的 扫描 。 


我 们 也 可 以 通过 给 :NameData 变 量 在 Go 语言 中 增加 一 个 不 含 指针 并 且 大 小 为 8 个 字 节 的 类 型 
来 修改 该 错误 : 

package pkg 

var NameData [8]byte 

var Name string 
我 们 将 NameData 声 明 为 长 度 为 8 的 字 节 数组 。 因 为 编译 器 可 以 通过 类 型 分 析出 该 变量 不 会 包 
含 指针 ， 因 此 汇编 代码 中 可 以 NOPTR 标 志 信息 。 


在 这 个 实现 中 ，Name 字 符 串 底层 其 实 引用 的 是 NameData 内 存 对 应 的 “gopher 字 符 串 数据 。 
因此 ， 如 果 NameData 发 生变 化 的 化 ， Name 字 符 串 的 数据 也 会 跟着 变化 的 。 


func main() { 
printin(pkg.Name) 


pkg.NameData[0] = '?' 
printin(pkg.Name) 


当然 这 和 字符 串 的 只 读 定义 是 冲突 的 ， 正 常 的 代码 需要 避免 出 现 这 种 情况 。 最 好 的 方法 是 不 
要 导出 内 部 的 NameData 变 量 ， 这 样 可 以 避免 内 部 数据 被 无 意 破 坏 。 
在 用 汇编 定义 字符 囊 时 ， 我 们 完全 一 个 换 一 种 思维 : 将 底层 的 字符 串 数据 和 字符 串 头 结构 体 
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定义 在 一 起 ， 这 样 可 以 避免 引入 NameData 符 号 : 


GLOBL :Name(SB), $24 


DATA :Name+0(SB)/8,$:Name+16(SB) 
DATA :Name+8(SB)/8, $6 
DATA :Name+16(SB)/8,$"gopher" 


在 新 的 结构 中 ，Name 符 号 对 应 的 内 存 从 16 字 节 变 为 24 字 节 ， 多 出 的 8 个 字 节 用 户 存放 底层 
的 “gopher 字 符 串 。:Name 符 号 前 16 个 字 节 依然 对 应 reflect.StringHeader 结 构 体 : Data 部 分 对 
应 $:Name+16(SB) ， 表 示 数 据 的 地 址 为 Name 符 号 往 后 偏 移 16 个 字 节 的 位 置 ; Len 部 分 依然 对 
应 6 个 字 节 的 长 度 。 


定义 main $ žk 
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前 面 的 例子 已 经 展示 的 如 何 通过 汇编 定义 整 型 和 字符 串 类 型 变量 。 我 们 现在 将 党 试用 汇编 实 


现 函 数 ， 然 后 输出 一 个 字符 串 。 


*- 


A.&smain.goX £t » AEAF B EE AA Amanha : 


package main 
var helloworld = "你 好 ， 上 世界 " 


func main() 


然后 创建 main_amd64.s 文 件 ， 里 面 对 应 main 函 数 的 实现 : 


TEXT -main(SB), $16-0 
MOVQ .helloworld+0(SB), AX; MOVQ AX, O(SP) 
MOVQ .helloworld+8(SB), BX; MOVQ BX, 8(SP) 
CALL runtime:printstring(SB) 
CALL runtime:printnl(SB) 
RET 


TEXT .main(SB), $16-0 用 于 定义 main Až > AF $16-6 表示 main 函数 的 帧 大 小 是 16 个 字 
节 (对 应 string 头 的 大 小 ， 用 于 给 runtime:printstring 函数 传递 参数 ) ^ 0 表示 main HAA 
有 参数 和 返回 值 ° main 函数 内 部 通过 调用 运行 时 内 部 的 runtime:printstring(SB) 函数 来 打印 
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字符 囊 。 然 后 调用 runtime:printnl 打 印 换行 符号 。 


Go 语言 函数 在 函数 调用 时 ， 完 全 通过 栈 传递 调用 参数 和 返回 值 。 先 通过 MOVQ 指 令 ， 将 
helloworld 对 应 的 字符 串 头 部 结构 体 的 16 个 字 节 复制 到 栈 指针 SP 对 应 的 16 字 节 的 空间 ， 然 后 
通过 CALL 指 令 调 用 对 应 函数 。 最 后 使 用 RET 指 令 表 示 当 前 函数 返回 。 


特殊 字符 


Go 语言 函数 或 方法 符号 在 编译 为 目标 文件 后 ， 目 标 文件 中 的 每 个 符号 均 包 含 对 应 包 的 绝对 导 
入 路 径 。 因 此 目标 文件 的 符号 可 能 非常 复杂 ， 比 如 "path/to/pkg. 
(*SomeType).SomeMethod "或 “go.string."abc"”。 目 标 文件 的 符号 名 中 不 仅仅 包含 普通 的 字 
母 ， 还 可 能 包含 诸多 特殊 字符 。 而 Go 语言 的 汇编 器 是 从 plan9 移 植 过 来 的 二 把 九 ， 并 不 能 处 理 
这 些 特殊 的 字符 ， 导 致 了 用 Go 汇编 语言 手工 实现 Go 诸多 特性 时 遇 到 种 种 限制 。 


Go 汇编 语言 同样 遵循 Go 语言 少 即 是 多 的 哲学 ， 它 只 保留 了 最 基本 的 特性 : 定义 变量 和 全 局 函 
数 。 同 时 为 了 简化 Go 汇编 器 的 词法 扫描 程序 的 实现 ， 特 别 引 入 了 Unicode 中 的 中 点 . fX 5 
的 除法 / ， 对 应 的 Unicode 码 点 为 u«ooB7 和 u«2215 。 汇 编 器 编译 后 ， 中 点 ,会 被 蔡 换 为 
ASCll 中 的 点 “.”， 大 写 点 除法 会 被 蔡 换 为 ASCII 码 中 的 除法 “P"P， 比 如 math/rand.Int 会 被 替换 
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为 math/rand.Int 。 这 样 可 以 将 点 和 浮 点 数 中 的 小 数 点 、 大 写 的 除法 和 表达 式 中 的 除法 符号 分 
开 ， 可 以 简化 汇编 程序 此 法 分 析 部 分 的 实现 。 

即使 暂时 抛 开 Go 汇 编 语 言 设计 取舍 的 问题 ， 中 点 , 和 除法 / 两 个 字符 的 如 何 输入 就 是 一 个 
挑战 。 这 两 个 字符 在 https://golang.org/doc/asm 文档 中 均 有 描述 ， 因 此 直接 从 该 页 面 复制 是 
最 简单 可 靠 的 方式 。 

如 果 是 macOS 系 统 ， 则 有 以 下 几 种 方法 输入 中 点 ， :在 不 开 输 入 法 时 ， 可 直接 用 
option+shift+9 输入 ; 如 果 是 自 带 的 简体 拼音 输入 法 ， 输 入 左上 角 ~ 键 对 应 . ， 如 果 是 自 带 
的 Unicode 输 入 法 ， 则 可 以 输入 对 应 的 Unicode 码 点 。 


没有 分 号 


Go 汇编 语言 中 分 号 可 以 用 于 分 隔 同 一 行内 的 多 个 语句 。 下 面 是 用 分 号 混乱 排版 的 汇编 代码 : 


TEXT .main(SB), $16-0; MOVQ .helloworld+0(SB), AX; MOVQ :helloworld+8(SB), BX; 
MOVQ AX, QO(SP);MOVQ BX, 8(SP);CALL runtime:printstring(SB); 

CALL runtime:printnl(SB); 

RET; 


和 Go 语言 一 样 ， 也 可 以 省 略 行 尾 的 分 号 。 当 遇 到 末尾 时 ， 汇 编 器 会 自动 插入 分 号 。 下 面 是 省 
略 分 号 后 的 代码 : 


TEXT :main(SB), $16-0 
MOVQ .helloworld+0(SB), AX; MOVQ AX, O(SP) 
MOVQ .helloworld+8(SB), BX; MOVQ BX, 8(SP) 
CALL runtime:printstring(SB) 
CALL runtime:printnl(SB) 
RET 


和 Go 语言 一 样 ， 语 和 句 之 间 多 个 连续 的 空白 字符 和 一 个 空格 是 等 价 的 。 


3.2. 计算 机 结构 


汇编 语言 是 直面 计算 机 的 编程 语言 ， 因 此 理解 计算 机 结构 是 掌握 汇编 语言 的 前 提 。 当 前 流行 
的 计算 机 基本 采用 的 是 冯 : 诺 伊 曼 计 算 机 体系 结构 (在 某 些 特殊 领域 还 有 哈佛 体系 架构 ) 。 冯 - 
诺 依 曼 结构 也 称 为 普林斯顿 结构 ， 采 用 的 是 一 种 将 程序 指令 和 数据 存储 在 一 起 的 存储 结构 。 
冯 . 诺 伊 曼 计算 机 中 的 指令 和 数据 存储 器 其 实 指 的 是 计算 机 中 的 内 存 ， 然 后 在 配合 CPU 处 理 器 
就 组 成 了 一 个 最 简单 的 计算 机 了 。 


汇编 语言 其 实 是 一 种 非常 简单 的 编程 语言 ， 因 为 它 面向 的 计算 机 模型 就 是 非常 简单 的 。 让 人 
觉得 汇编 语言 难 学 主要 有 几 个 原因 : 不 同类 型 的 CPU 都 有 自己 的 一 套 指 令 ; 即 是 是 相同 的 

CPU，32 位 和 64 位 的 运行 模式 依然 会 有 差异 ; 不 同 的 汇编 工具 同样 有 自己 特有 的 汇编 指令 ; 
不 同 的 操作 系统 和 高 级 编程 语言 和 底层 汇编 的 调用 规范 并 不 相同 。 本 节 将 描述 几 个 有 趣 的 汇 
编 语言 模型 ， 最 后 精简 出 一 个 适用 于 AMD64 架 构 的 精简 指令 集 ， 以 便于 Go 汇编 语言 的 学 习 。 


图 灵机 和 BF 语言 


图 灵机 是 由 图 灵 提 出 的 一 种 抽象 计算 模型 。 机 器 有 一 条 无 限 长 的 纸 带 ， 纸 带 分 成 了 一 个 一 个 
的 小 方 格 ， 每 个 方 格 有 不 同 的 颜色 ， 这 类 似 于 计算 机 中 的 内 存 。 同 时 机 器 有 一 个 探头 头 在 纸 
带 上 移 来 移 去 ， 类 似 于 通过 内 存 地 址 来 读 写 内 存 上 的 数据 。 机 器 头 有 一 组 内 部 计算 状态 ， 还 
有 一 些 固 定 的 程序 (更 像 一 个 哈佛 结构 )。 在 每 个 时 刻 ， 机 器 头 都 要 从 当前 纸 带 上 读 入 一 个 
方 格 信息 ， 然 后 根据 自己 的 内 部 状态 和 当前 要 执行 的 程序 指令 将 信息 输出 到 纸 带 方 格 上 ， 同 
时 更 新 自己 的 内 部 状态 并 进行 移动 。 


图 灵机 虽然 不 容易 编程 ， 但 是 非常 容易 理解 。 有 一 种 极 小 化 的 BrainFuck 计 算 机 语言 ， 它 的 工 


思想 


Muller 最 初 的 设计 目标 是 建立 一 种 简单 的 、 可 以 用 最 小 的 编译 器 来 实现 的 、 符 合 图 灵 完 全 思想 
的 编程 语言 。 这 种 语言 由 八 种 状态 构成 ， 早 期 为 Amiga 机 器 编写 的 编译 器 (第 二 版 ) 只 有 240 


个 字 节 大 小 ! 


就 象 它 的 名 字 所 暗示 的 ，brainfuck 程 序 很 难 读 懂 。 尽 管 如 此 ，brainfuck 图 灵机 一 样 可 以 完成 
任何 计算 任务 。 虽 然 brainfuck 的 计算 方式 如 此 与 众 不 同 ， 但 它 确实 能 够 正确 运行 。 这 种 语言 
基于 一 个 简单 的 机 器 模型 ， 除 了 指令 ， 这 个 机 器 还 包括 : 一 个 以 字 节 为 单位 、 被 初始 化 为 零 
的 数组 、 一 个 指向 该 数组 的 指针 (初始 时 指向 数组 的 第 一 个 字 节 ) 、 以 及 用 于 输入 输出 的 两 
个 字 节 流 。 这 种 语言 ， 是 一 种 按照 “Turing complete (完整 图 灵机 ) "思想 设计 的 语言 ， 它 的 
主要 设计 思路 是 : 用 最 小 的 概念 实现 一 种 “简单 "的 语言 ，BrainF**k 语言 只 有 八 种 符号 ， 所 有 
的 操作 都 由 这 八 种 符号 的 组 合 来 完成 。 


下 面 是 这 八 种 状态 的 描述 ， 其 中 每 个 状态 由 一 个 字符 标识 : 





" C 语 言 类 比 含义 
> ++ptr; 指针 加 一 
< --ptr; 指针 减 一 
+ ++*ptr; 指针 指向 的 字 节 的 值 加 一 
“ptr; 指针 指向 的 字 节 的 值 减 一 


ae 输出 指针 指向 的 单元 内 容 (ASCA ) 


DE o 输入 内 容 到 指针 指向 的 单元 (ASCII ) 

[ while(*ptr) {} zo c Nue a ER SRCN 指令 的 次 

] 如 果 指 针 指 向 的 单元 值 不 为 零 ， 向 前 跳 转 到 对 应 的 [ 指令 的 
次 一 指令 处 


下 面 是 一 个 brainfuck 程序 ， 向 标准 输出 打印 "hi" 字 符 串 : 


十 十 十 十 十 十 十 十 十 十 [> 十 十 十 十 十 十 二 十 十 十 < - ] > 十 十 + 十 .十 。 


理论 上 我 们 可 以 将 BF 语言 当 作 目标 机 器 语言 ， 将 其 它 高 级 语言 编译 为 BF 语言 后 就 可 以 在 BF 机 


器 上 运行 了 。 


人 力 资 源 机 器 游戏 


《人 力 资 源 机 器 》 (Hunman Resource Machine) 是 一 款 设计 精良 汇编 语言 编程 游戏 。 在 游 
戏 中 ， 玩 家 扮演 一 个 职员 角色 ， 来 模拟 人 力 资源 机 器 的 运行 。 通 过 完成 上 司 给 的 每 一 份 任务 
来 实现 晋升 的 目标 ， 完 成 任务 的 途径 就 是 用 游戏 提供 的 11 个 机 器 指令 编写 正确 的 汇编 程序 ， 
最 终 得 到 正确 的 输出 结果 。 人 力 资 源 机 器 的 汇编 语言 可 以 认为 是 跨 平台 、 跨 操作 系统 的 通用 
的 汇编 语言 ， 因 为 在 macOS、Windows、Linux 和 iOS 上 该 游戏 的 玩法 都 是 完全 一 致 的 。 

人 力 资 源 机 器 的 机 器 模型 非常 简单 : INBOX 命 令 对 应 输入 设备 ，OUTBOX 对 应 输出 设备 ， 玩 
家 小 人 对 应 一 个 寄存 器 ， 临 时 存放 数据 的 地 板 对 应 内 存 ， 然 后 是 数据 传输 、 加 减 、 跳 转 等 几 
本 的 指令 。 总 共有 11 个 机 器 指令 : 


名 称 解释 

INBOX 从 输入 通道 取 一 个 整数 数据 ， 放 到 手中 (寄存 器 ) 

UEO 将 手中 (寄存 器 ) 的 数据 放 到 输出 通道 ， 然 后 手中 将 没有 数据 (此 时 有 
些 指令 不 能 运行 ) 
将 地 板 上 某 个 编号 的 格子 中 的 数据 复制 到 手中 (手中 之 前 的 数据 作 

COPYFROM | à b TENA RR 

ON C poc IL d RU LUE 
DEOS 

XBD 将 手中 (寄存 器 ) 的 数据 和 某 个 编号 对 应 的 地 板 格子 的 数据 相 加 ， 新 数 
据 放 到 手中 (手中 之 前 的 数据 作废 ) 

UE 将 手中 (寄存 器 ) 的 数据 和 某 个 编号 对 应 的 地 板 格子 的 数据 相 减 ， 新 数 
据 放 到 手中 (手中 之 前 的 数据 作废 ) 

BUMP+ 自 加 一 

BUMP- 自 减 一 

JUMP 跳 转 

JUMP =0 为 零 条 件 跳 转 

JUMP <0 为 负 条 件 跳 转 


除了 机 器 指令 外 ， 游 戏 中 有 些 环节 还 提供 类 似 寄存 器 的 场所 ， 用 于 存放 临时 的 数据 。 人 力 资 
源 机 器 游戏 的 机 器 指令 主要 分 有 以 下 几 类 : 


。 输入 /输出 (INBOX, OUTBOX): 输入 后 手中 将 只 有 1 份 新 拿 到 的 数据 , 输出 后 手中 将 没有 数 
据 。 

e 数据 传输 指令 (COPYFROM/COPYTO): 主要 用 于 仅 有 的 1 个 寄存 器 (手中 ) 和 内 存 之 间 
的 数据 传输 ， 传 输 时 要 确保 源 数据 是 有 效 的 

e 算术 相关 (ADD/SUB/BUMP+/BUMP-) 

e 跳 转 指令 : 如 果 是 条 件 跳 转 ， 寄 存 器 中 必须 要 有 数据 


主流 的 处 理 器 也 有 类 似 的 指令 。 除 了 基本 的 算术 和 逮 辑 预算 指令 外 ， 在 配合 有 条 件 跳 转 指令 
就 可 以 实现 分 支 、 循 环 等 常见 控制 流 结构 了 。 


下 图 是 茶 一 层 的 任务 : 将 输入 数据 的 0 别 除 ， 非 0 的 数据 依次 输出 ， 右 边 部 分 是 解决 方案 。 
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整个 程序 只 有 一 个 输入 指令 、 一 个 输出 指令 和 两 个 跳 转 指令 共 四 个 指令 : 


LOOP : 
INBOX 
JUMP-if-zero LOOP 
OUTBOX 
JUMP LOOP 


首先 通过 INBOX 指 令 读 取 一 个 数据 包 ; 然后 判断 包 训 的 数据 是 否 为 0， 如 果 是 0 的 话 就 跳 转 到 
开头 继续 读 取 下 一 个 数据 包 ; 否则 将 输出 数据 包 ， 然 后 再 跳 转 到 开头 。 以 此 循环 无 休止 地 处 
理 数 据 包 衰 ， 直 到 任务 完成 晋升 到 更 高 一 级 的 岗位 ， 然 后 处 理 类 似 的 但 更 复杂 的 任务 。 


精简 X86-64 指 令 集 


X86 其 实 是 是 80X86 的 简称 (后 面 三 个 字母 )， 和 包括 Intel 8086、80286、80386 以 及 80486 等 
虽 令 集合， 因此 其 架构 被 称 为 X86 架 构 。Xx86-64 是 AMD 公 司 于 1999 年 设计 的 X86 架 构 的 64 位 拓 
展 ， 向 后 兼容 于 16 位 及 32 位 的 x86 架 构 。X86-64 目 前 正式 名 称 为 AMD64， 也 就 是 Go 语言 中 
GOARCH 环 境 变量 指定 的 AMD64“。 如 果 没 有 特殊 说 明 的 话 ， 本 章 中 的 汇编 程序 都 是 针对 64 位 
的 X86-64 环 境 。 


很 多 汇编 语言 的 教程 都 会 强调 汇编 语言 是 不 可 移植 的 。 严 格 来 说 很 多 汇编 语言 在 不 同 的 CPU 
类 型 、 或 不 同 的 操作 系统 环境 、 或 不 同 的 汇编 工具 链 下 是 不 可 移植 的 。 而 这 种 不 可 移植 性 正 
是 汇编 语言 普及 的 一 个 极 大 的 障碍 。 虽 然 CPU 指 令 集 的 差异 是 导致 不 好 移植 的 较 大 因素 ， 但 
是 汇编 语言 的 相关 工具 链 对 此 也 有 不 可 推 扼 的 责任 。 而 源 自 Plan9 的 Go 汇编 语言 对 此 做 了 一 定 
的 改进 : 首先 Go 汇编 语言 在 相同 CPU 架 构 上 是 完全 一 致 的 ， 也 就 是 屏蔽 了 操作 系统 的 差异 ; 


同时 Go 汇编 语言 将 一 些 基 础 并 且 类 似 的 指令 抽象 为 相同 名 字 的 伪 指 令 ， 从 而 减少 不 同 CPU 架 
构 下 汇编 代码 的 差异 ( 当然， 寄存 器 名 字 和 数量 的 差异 是 一 直 存 在 的 ) 。 本 节 的 目的 也 是 找 
出 一 个 较 小 的 精简 指令 集 ， 以 简化 Go 汇编 语言 学 习 的 目的 。 


下 面 是 X86/AMD 架 构图 : 


X86/AMD64 Architecture 


high FLAGS MOV / LEA 
CMP /TEST/JMP /J[CC] 
PUSH /POP 


CALL /RET 


X 


ADD /SUB/MUL /DIV 
AND/OR/XOR/NOT 
SHL /SHR 


R8-R15 


low 


E 
ES 





Memory Register Instructions 


寄存 器 是 CPU 中 最 重要 的 资源 ， 每 个 要 处 理 的 内 存 数据 原则 上 需要 先 放 到 寄存 器 中 才能 由 
CPU 处 理 ， 同 时 寄存 器 中 处 理 完 的 结果 需要 再 存 入 内 存 。X86 中 除了 状态 寄存 器 和 指令 指令 两 
个 特殊 的 寄存 器 外 ， 还 有 AX、BX、CX、DX、SI、DI、BP、SP 几 个 通用 寄存 器 。 在 X86-64 
中 又 增加 了 八 个 以 R8-R15 方 式 命名 的 通用 寄存 器 。 因 为 历史 的 原因 RO-R7 并 不 是 通用 寄存 

器 ， 它 们 只 是 X87 开始 引入 的 MMX 指 令 专 有 的 寄存 器 。 在 通用 寄存 器 中 BP 和 SP 是 两 个 比较 特 
殊 的 寄存 器 : 其 中 BP 用 于 记录 当前 部 数 帧 的 开始 位 置 ， 和 部 数 调 用 相关 的 指令 会 隐 式 地 影响 
SP 的 值 ; SP 则 对 应 当前 栈 指针 的 位 置 ， 和 栈 相关 的 指令 会 隐 式 地 影响 SP 的 值 。 


X86 是 一 个 极其 复杂 的 系统 ， 有 人 统计 Xx86-64 中 指令 有 将 近 一 千 个 之 多 。 不 仅仅 如 此 ，X86 中 
的 很 多 单个 指令 的 功能 也 非常 强大 ， 比 如 有 论文 证 明了 仅仅 一 个 MOV 指 令 就 可 以 构成 一 个 图 
灵 完 备 的 系统 。 以 上 这 是 两 种 极端 情况 ， 太 多 的 指令 和 太 少 的 指令 都 不 利于 汇编 程序 的 纺 

写 。 通 用 的 基础 机 器 指令 大 概 可 以 分 为 数据 传输 指令 、 算 术 运 算 和 逻辑 运算 指令 、 控 制 流 指 

令 等 几 类 。 因 此 我 们 将 尝试 精简 出 一 个 X86-64 指 令 集 ， 以 便于 Go 汇编 语言 的 学 习 。 

基础 的 数据 传输 指令 有 MOV、LEA、PUSH、POP 等 几 个 。 其 中 MOV 指 令 可 以 用 于 将 字面 值 


移动 到 寄存 器 、 字 面值 移 到 内 存 、 寄 存 器 之 间 的 数据 传输 、 寄 存 器 和 内 存 之 间 的 数据 传输 。 
需要 注意 的 是 ，MOV 传 输 指令 的 内 存 操作 数 只 能 有 一 个 ， 可 以 通过 某 个 临时 寄存 器 要 达到 类 


似 目 的 。LEA 指 令 将 标 参 数 准 格式 中 的 内 存 地 址 加 载 到 寄存 器 (而 不 是 加 载 内 存 位 置 的 内 
4) 。PUSH 和 POP 分 别 是 压 栈 和 出 栈 指 令 ， 通 用 寄存 器 中 的 SP 为 栈 指针 ， 栈 是 向 低地 址 方 
向 增长 的 。 


名 称 解释 
MOV 数据 转移 
LEA 取 地 址 
PUSH ER 
POP 出 栈 


基础 算术 指令 有 ADD、SUB、MUL、DIV 等 指令 。 其 中 ADD、SUB、MUL、DIV 用 于 加 、 减 、 
乘 、 除 运算 ， 最 终结 果 存 入 目标 寄存 器 。 基 础 的 逻辑 运算 指令 有 AND、OR 和 NOT 等 几 个 指 
令 ， 对 应 逻辑 与 、 或 和 取 反 等 几 个 指令 。 


名 称 解释 
ADD 加 法 
SUB 减法 
MUL 乘法 
DIV 除法 
AND 逻辑 与 
OR 逻辑 或 
NOT ZARA 


控制 流 指令 有 CMP、JMP-ifx、JMP、CALL、RET 等 指令 。CMP 指 令 用 于 两 个 操作 数 做 减 
法 ， 根 据 比 较 结 果 设置 状态 寄存 器 的 符号 位 和 零 位 ， 可 以 用 于 有 条 件 跳 转 的 跳 转 条 件 。JMP- 
if-Xx 是 一 组 有 条 件 跳 转 指令 ， 常 用 的 有 JL、JLZ、JE、JNE、JG、JGE 等 指令 ， 对 应 小 于 、 人 小 
于 等 于 、 等 于 、 不 等 于 、 大 于 和 大 于 等 于 等 条 件 时 跳 转 。JMP 指 令 则 对 应 无 条 件 跳 转 ， 将 要 
跳 转 的 地 址 设置 到 IP 指 令 寄存 器 就 实现 了 跳 转 。 而 CALL 和 RET 指 令 分 别 为 调用 函数 和 函数 返 
回 指令 。 


名 称 解释 
JMP 无 条 件 跳 转 
JMP-if-x 有 条 件 跳 转 ，JL、JLZ、JE、JNE、JG、JGE 
CALL 调用 函数 


RET 函数 返回 


为 了 简单 我 们 省 略 了 位 运算 指令 ， 很 多 高 级 指令 。 完 整 的 X86 指 令 在 
https://github.com/golang/arch/blob/master/x86/x86.csv 文件 定义 。 同 时 Go 汇编 还 正 对 一 些 
指令 定义 了 别名 ， 具 体 可 以 参考 这 里 https://golang.org/src/cmd/internal/obj/x86/anames.go 


o 


Go 汇编 中 的 伪 寄 存 器 


Go 汇编 为 了 简化 汇编 代码 的 编写 ， 引 入 了 PC、FP、SP、SB 四 个 伪 寄 存 器 。 四 个 伪 寄 存 器 和 
X86/AMD64 的 内 存 和 寄存 器 的 相互 关系 如 下 图 : 
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在 AMD64 环 境 ， 伪 PC 寄存 器 其 实 是 |P 指 令 计数 器 寄存 器 的 别名 。 伪 FP 寄存 器 对 应 的 是 函数 
的 帧 指针 ， 一 般 用 来 访问 函数 的 参数 和 返回 值 。 伪 SP 栈 指针 对 应 的 是 当前 函数 栈 帧 的 底部 
(不 保护 参数 和 返回 值 部 分 ) ， 一 般 用 于 定位 局 部 变量 。 伪 SP 是 一 个 比较 特殊 的 寄存 器 ， 因 
为 还 存在 一 个 同名 的 SP 申 寄 存 器 。 由 SP 寄存 器 对 应 的 是 栈 的 顶部 ， 一 般 用 于 定位 调用 其 它 函 
数 的 参数 和 返回 值 。 


当 需 要 区 分 擅 寄 存 器 和 真 寄 存 器 的 时 候 只 需要 记 住 一 点 : 伪 寄 存 器 一 般 需 要 一 个 标识 符 和 偏 
BEIMA’ RAAKAA ATAR o rba (sP) ^ +8(SP) AUR A IR FERE AR A 


SP 寄存 器 ， 而 a(SP) ^ b+8(SP) 有 标识 符 为 前 组 表示 伪 寄 存 器 。 


Sos 


3.3. 第 量 和 全 局 变量 


程序 中 的 一 切 变量 的 初始 值 都 直接 或 间接 地 依赖 常量 或 常量 表达 式 生成 。 在 Go 语言 中 很 多 变 
量 是 默认 零 值 初始 化 的 ， 但 是 Go 汇编 中 定义 的 变量 最 好 还 是 手工 通过 常量 初始 化 。 有 了 常量 
之 后 ， 就 可 以 定义 全 局 变量 ， 并 使 用 常量 组 成 的 表达 式 初始 化 全 部 变量 。 本 节 将 简单 讨论 Go 
汇编 语言 中 常量 和 全 局 变量 的 用 法 。 


LA 
mu 


Go 汇编 语言 中 常量 以 $ 美 元 符号 为 前 级 。 常 量 的 类 型 有 整数 常量 、 浮 点 数 常量 、 字 符 常量 和 字 
符 串 常量 等 几 种 类 型 。 以 下 是 几 种 类 型 常量 的 例子 : 


$1 // 十 进 制 
$0xf4f8fcff // 十 六 进 制 
$1.5 // 浮 点 数 
$'a' // 字符 
$"abcd" // 字符 串 


其 中 整数 类 型 常量 默认 是 十 进 制 格式 ， 也 可 以 用 十 六 进 制 格式 表示 整数 常量 。 所 有 的 常量 最 
终 都 必须 和 要 初始 化 的 变量 内 存 大 小 匹配 o 


对 于 数值 型 常量 ， 可 以 通过 常量 表达 式 构成 新 的 常量 : 


$242 // 常量 表达 式 
$3&1<<2 // == $4 
$(3&1)««2 // == $4 


其 中 常量 表达 式 中 运算 符 的 优先 级 和 Go 语言 保持 一 致 。 


全 局 变量 


在 Go 语言 中 ， 变 量 根据 作用 域 和 生命 周期 有 全 局 变量 和 局 部 变量 之 分 。 全 局 变量 是 包 一 级 的 
变量 ， 全 局 变量 一 般 有 着 较为 国定 的 内 存 地 址 ， 声 明 周期 跨越 整个 程序 运行 时 间 。 而 局 部 变 
量 一 般 是 函数 内 定义 的 的 变量 ， 只 有 在 子 数 被 执行 的 时 间 才 能 被 创建 ， 当 函数 完成 时 将 回回 
收 (暂时 不 考虑 闭 包 对 局 部 变量 捕获 的 问题 ) o 

从 Go 汇编 语言 角度 来 看 ， 局 部 变量 和 局 部 变量 也 大 的 差异 。 在 Go 汇编 中 全 局 变量 和 全 局 函数 
更 为 相似 ， 都 是 通过 一 个 认为 定义 的 符号 来 引用 对 应 的 内 存 ， 区 别 只 是 内 存 中 存放 是 数据 还 
是 要 执行 的 指令 。 因 为 在 冯 诺 伊 曼 系 统 结构 的 计算 机 中 指令 也 是 数据 ， 而 且 指 令 和 数据 存放 
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在 统一 编 址 的 内 存 中 ， 因 此 指令 和 数据 并 没有 本 质 的 差别 一 一 我 们 甚至 可 以 像 操 作 数 据 那 样 
动态 生成 指令 。 而 局 部 变量 则 需 了 解 了 汇编 函数 之 后 ， 通 过 SP 栈 空间 来 隐 式 定义 。 


var num [2]int 
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在 Go 汇编 语言 中 ， 内 存 是 通过 SB 伪 寄 存 器 定位 。SB 是 Static base pointer) i € > 379 3$ 
内 存 的 开始 地 址 。 所 有 的 静态 全 局 符号 通过 可 以 通过 SB 加 一 个 偏 移 量 定位 ， 而 我 们 定义 的 符 
号 其 实 就 是 相对 于 SB 内 存 开 始 地 址 偏 移 量 。 对 于 SB 伪 寄 存 器 ， 全 局 变量 和 全 局 函数 的 符号 并 
没有 任何 区 别 。 





要 定义 全 局 变量 ， 首 先 要 声明 一 个 变量 对 应 的 符号 ， 以 及 变量 对 应 的 内 存 大 小 。 导 出 变量 符 
号 的 语法 如 下 : 


GLOBL symbol(SB), width 


GLOBL T /& 48 4 AT UE LU MEE | 变量 对 应 的 内 存 宽 度 为 width， 内 存 宽 度 部 分 必 
须 用 常量 初始 化 。 下 面 的 代码 通过 汇编 定义 一 个 int32 类 型 的 count 变 量 : 


GLOBL .count(SB),$4 


其 中 符号 .count 以 中 点 开头 表示 是 当前 包 的 变量 ， 最 终 符号 名 为 被 展开 

为 path/to/pkg.count 。count 变 量 的 大 小 是 4 个 字 节 ， 常 量 必 须 以 $ 美 元 符号 开头 。 内 存 的 宽 
度 必 须 是 2 的 指数 倍 ， 编 译 器 最 d d pe a 字 宽 度 。 需 要 注意 的 是 ， 
在 Go 汇编 中 我 们 无 法 为 count 变 量 指定 具体 的 类 型 。 在 汇编 中 定义 全 局 变量 时 ， 我 们 值 关心 变 
量 的 名 字 和 内 存 大 小 ， Hep AMA 言 中 声明 。 


变量 定义 之 后 ， 我 们 可 以 通过 DATA 汇 编 指 令 指 定 对 应 内 存 中 的 数据 ， 语 法 如 下 : 
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DATA symbol-*offset(SB)/width, value 


Dd 


具体 的 含义 是 从 symbol+offset 偏 移 量 开 始 ，width 宽 度 的 内 存 ， 用 value 常 量 对 应 的 值 初始 化 。 
DATA 初 始 化 内 存 时 ，width 必 须 是 1、2、4、8 几 个 宽度 之 一 ， 因 为 再 大 的 内 存 无 法 一 次 性 用 
一 个 uint64 大 小 的 值 表示 。 


d 


对 于 int32 类 型 的 count 变 量 来 说 ， 我 们 既 可 以 逐个 字 节 初始 化 ， 也 可 以 一 次 性 初始 化 : 


DATA :count+0(SB)/1,$1 
DATA :count-*1(SB)/1,$2 
DATA :count-2(SB)/1, $3 
DATA :count-*3(SB)/1,$4 
// or 


DATA :count-*0(SB)/4, $0x01020304 


因为 X86 处 理 器 是 小 端 序 ， 因 此 用 十 六 进 制 0x01020304 初 始 化 全 部 的 4 个 字 节 ， 和 用 1、2、 
3、4 逐 个 初始 化 4 个 字 节 是 一 样 的 效果 。 


最 后 还 需要 在 GO 语言 中 声明 对 应 的 变量 (和 C 语 言 头 文件 声明 变量 的 作用 类 似 ) ， 这 样 垃圾 
回收 器 会 更 加 变量 的 类 型 来 管理 其 中 的 指针 相关 的 内 存 数 据 。 


变量 的 布局 


var num [2]int 
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var num [2]int 
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bool? 变量 


Go 汇编 语言 定义 变量 无 法 指定 类 型 信息 ， 因 此 需要 先 通过 Go 语言 声明 变量 的 类 型 。 以 下 是 在 


Go 语言 中 声明 的 几 个 bool 类 型 变量 : 


var ( 
boolValue bool 
trueValue bool 
falseValue bool 


在 Go 语言 中 声明 的 变量 不 能 含有 初始 化 语句 。 然 后 下 面 是 amd64 环 境 的 汇编 定义 : 
GLOBL .boolValue(SB),$1  // 未 初始 化 


GLOBL :trueValue(SB),$1 // var trueValue - true 
DATA :trueValue(SB)/1,$1 // 3k 0 均 为 true 


GLOBL :falseValue(SB),$1 // var falseValue = true 


DATA :falseValue(SB)/1,3$0 


bool 类 型 的 内 存 大 小 为 1 个 字 节 。 并 且 汇 编 中 定义 的 变量 需要 手工 指定 初始 化 值 ， 否 则 将 可 能 
导致 产生 未 初始 化 的 变量 。 


-— 


int! 变量 


所 有 的 整数 类 型 均 有 类 似 的 定义 的 方式 ， 比 较 大 的 差异 是 整数 类 型 的 内 存 大 学 和 整数 是 否 是 
有 符号 。 下 面 是 声明 的 int32 和 uint32 类 型 变量 : 


var int32Value int32 


var uint32Value uint32 


在 Go 语言 中 声明 的 变量 不 能 含有 初始 化 语句 。 然 后 下 面 是 amd64 环 境 的 汇编 定义 : 


GLOBL .int32Value(SB),$4 

DATA .:int32Value*0(SB)/1,$0x01 // 第 9 字 
DATA -.int32Value-1(SB)/1,$0x02 // 第 1 字 节 
DATA .int32Value+2(SB)/2,$0x03 // 第 3-4 字 节 
GLOBL -uint32Value(SB),$4 

DATA 'Uint32Value(SB)/4,$9x91020304 // 第 1-4 字 节 


汇编 定义 变量 时 并 不 区 分 整数 是 否 有 符号 。 


float? 变量 


Go 汇编 语言 通用 无 法 取 区 分 变量 是 否 是 浮 点 数 类 型 ， 之 上 相关 的 浮 点 数 机 器 指令 会 将 变量 当 
作 浮 点 数 处 理 。Go 语 言 的 浮 点 数 遵 循 IEEE754 标 准 ， 有 float32 单 精度 浮 点 数 和 float64 双 精度 
浮 点 数 之 分 。 


IEEE754 标 准 中 ， 最 高 位 1bit 为 符号 位 ， 然 后 是 指数 位 (指数 为 采用 移 码 格 式 表示 ) ， 然 后 是 
有 效 数 部 分 (其 中 小 数 点 左边 的 一 个 bit 位 被 省 略 ) 。 下 图 是 IEEE754 中 float32 类 型 浮 点 数 的 
bit 布 局 : 
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IEEE754 浮 点 数 还 有 一 些 奇妙 的 特性 : 比如 有 正 负 两 个 0 ; 除了 无 穷 大 和 无 穷 小 还 有 inf 非 数 ; 
同时 如 果 两 个 浮 点 数 如 果 有 序 那 么 bit 对 应 的 整数 也 是 有 序 的 。 


下 面 是 在 Go 语言 中 先 声 明 两 个 浮 点 数 (如 果 没 有 在 汇编 中 定义 变量 ， 那 么 声明 的 同时 也 会 定 
义 变 量 ) 。 
var float32Value float32 


var floate4Value float64 


然后 在 汇编 中 定义 并 初始 化 浮 点 数 : 


GLOBL :float32Value(SB), $4 
DATA :float32Value*0(SB)/4,$1.5 // var float32Value = 1.5 


GLOBL -floate4Value(SB), $8 
DATA :floate4Value(SB)/4,$0x01020304 // bit 方式 初始 化 


我 们 在 上 一 节 精 简 的 算术 指令 中 都 是 针对 整数 ， 如 果 要 通过 整数 指令 的 处 理 浮 点 数 加 减法 必 
须根 据 浮 点 数 的 运算 规则 进行 : 先 对 齐 小 数 点 ， 然 后 进行 整数 加 减法 ， 最 后 再 对 结果 进行 归 
一 化 并 处 理 精 度 舍 入 问题 。 


从 Go 汇编 语言 角度 看 ， 字 符 串 只 是 一 种 结构 体 。string 的 头 结构 定义 如 下 : 


type reflect.StringHeader struct { 
Data uintptr 
Len int 


在 amd64 环 境 中 StringHeader 有 16 个 字 节 大 写 ， 因 此 我 们 先 在 Go 代码 声明 字符 串 比 阿里 ， 然 


后 在 汇编 中 定义 一 个 16 字 节 大 小 的 变量 : 


var helloworld string 


GLOBL .:helloworld(SB), $16 


fe] E 4E] ST L2 SERE BE URGE SU GE o ETE RARE Po AUTE SLT — text 3p CE 
内 的 私有 变量 (以 <> 为 后 级 名 ) > ARA “Hello World" : 


GLOBL text<>(SB), $16 
DATA text<>+0(SB)/8,$"Hello Wo" 
DATA text<>+8(SB)/8,$"rld!" 


虽然 text 私 有 变量 表示 的 字符 串 只 有 12 个 字符 长 度 ， 但 是 我 们 依然 需要 将 变量 的 长 度 扩 展 为 2 


的 指数 倍数 ， 这 里 也 就 是 16 个 字 节 的 长 度 。 
然后 使 用 text 私 有 变量 对 应 的 内 存 地 址 来 初始 化 字符 串 头 结构 体 中 的 Data 部 分 ， 并 且 手 工 指 定 
Len 部 分 为 字符 串 的 长 度 : 


DATA :helloworld*0(SB)/8,$text«»(SB) // StringHeader.Data 


DATA :helloworld-*8(SB)/8,$12 // StringHeader.Len 


类 型 ， 要 避免 在 汇编 中 直接 修改 字符 串 底层 数据 的 内 容 。 


slice 类 型 变量 


slice 变 量 和 string 变 量 相似 ， 只 不 过 是 对 应 的 是 切片 头 结构 体 而 已 。 切 片头 的 结构 如 下 : 


type reflect.SliceHeader struct ( 
Data uintptr 
Len int 
Cap int 


对 比 可 以 发 现 ， 切 片 的 头 的 前 2 个 成 员 字 符 串 是 一 样 的 。 因 此 我 们 可 以 在 前 面 字符 串 变 量 的 基 
础 上 ， 再 扩展 一 个 Cap 成 员 就 成 了 切片 类 型 了 : 


var helloworld []byte 


GLOBL :helloworld(SB), $24 // var helloworld []byte("Hello World!") 
DATA :helloworld*0(SB)/8,$text«»(SB) // StringHeader.Data 

DATA :helloworld-*8(SB)/8,$12 // StringHeader.Len 

DATA :helloworld-*16(SB)/8,$16 // StringHeader.Len 


GLOBL text«»(SB), $16 


DATA text«2-0(SB)/8,$"Hello Wo" // ...String data... 
DATA text<>+8(SB)/8,$"rld!" // ...String data... 
因为 切片 和 字符 串 的 相 容 性 ， 我 们 可 以 将 切片 头 的 前 16 个 字 节 临时 作为 字符 串 使 有 用， 这样 可 


以 省 去 不 必要 的 转换 。 


map/channel 3: 78 % € 


map/channel 等 类 型 并 没有 公开 的 内 部 结构 ， 它 们 只 是 一 种 未 知 类 型 的 指针 ， 无 法 直接 初始 
化 。 在 汇编 代码 中 我 们 只 能 为 类 似 变 量 定义 并 进行 0 值 初始 化 : 
var m map[string]int 


var ch chan int 


GLOBL :m(SB),$8 // var m map[string]int 
DATA -m*0(SB)/8, $0 


GLOBL :ch(SB),$8 // var ch chan int 


DATA -ch-40(SB)/8, $0 


在 runtime 包 其 实 为 汇编 提供 了 一 些 辅助 函数 。 比 如 在 汇编 中 可 以 通过 runtime.makemap 和 
runtime.makechan 内 部 函数 来 创建 nap 和 chan 变 量 。 辅 助 函 数 的 签名 如 下 : 


func makemap(mapType *byte, hint int, mapbuf *any) (hmap map[any]any) 
func makechan(chanType *byte, size int) (hchan chan any) 


需要 注意 的 是 ，makemap 遂 数 可 以 创建 不 同类 型 的 map，map 的 具体 类 型 是 通过 mapType 参 
数 指定 。 


标识 符 规 则 和 特殊 标志 


Go 语言 的 标识 符 可 以 由 绝对 的 包 路 径 加 标识 符 本 身 定 位 ， 因 此 不 同 包 中 的 标识 符 即使 同名 也 
不 会 有 问题 。Go 汇 编 是 通过 特殊 的 符号 来 表示 斜 本 和 点 符号 ， 因 为 这 样 可 以 简化 汇编 器 词法 
扫描 部 分 代码 的 编写 ， 只 要 通过 字符 串 替 换 就 可 以 了 。 


下 面 是 汇编 中 常见 的 几 种 标识 符 的 使 用 方式 (通用 也 适用 于 函数 标识 符 ) 
GLOBL .:pkg namei1(SB),$1 


GLOBL main:pkg name2(SB),$1 
GLOBL my/pkg-pkg name(SB), $1 


此 外 ，Go 汇 编 中 可 以 可 以 定义 仅 当 前 文件 可 以 访问 的 私有 标识 符 (类 似 C 语 言 中 文件 内 static 
修饰 的 变量 ) ， 以 <> 为 后 级 


GLOBL file_private<>(SB),$1 


这 样 可 以 减少 私有 标识 符 对 其 它 文件 内 标识 符 命名 的 干扰 。 


此 外 ，Go 汇 编 语言 还 在 "textflag.h" 文 件 定义 了 一 些 标志 。 其 中 用 于 变量 的 标志 有 个 DUPOK、 
RODATA 和 NOPTR 几 个 。DUPOK 表 示 该 变量 对 应 的 标识 符 可 能 有 多 个 ， 在 链接 时 只 选择 其 
中 一 个 即 可 (一般 用 于 合并 相同 的 常量 字符 串 ， 减 少 重复 数据 占用 的 空间 ) 。RODATA 标 志 
表示 将 变量 定义 在 只 读 内 存 段 ， 因 此 后 续 任何 对 此 变量 的 修改 操作 将 导致 异常 (panic 也 无 法 
捕获 ) 。NOPTR 则 表示 此 变量 的 内 部 不 含 指 针 数 据 ， 让 垃圾 回收 器 忽略 对 该 变量 的 扫描 。 如 
果 变 量 已 经 在 Go 代码 中 声明 过 的 话 ，Go 编 译 器 会 自动 分 析出 该 变量 是 否 包 含 指 针 ， 这 种 时 候 
可 以 不 用 手写 NOPTR 标 志 。 


下 面 是 通过 汇编 来 定义 一 个 只 读 的 int 类 型 的 变量 : 


var const id int // readonly 


zinclude "textflag.h" 


GLOBL :const id(SB),NOPTR|RODATA, $8 
DATA -const id*0(SB)/8,$9527 


我 们 使 用 帮 nclude 语 名 包含 定义 标志 的 "textflag.h" 头 文件 (feCi& & v Tü4b 3948 E] ) 。 然 后 
GLOBL 汇 编 命 令 在 定义 变量 时 ， 给 变量 增加 了 NOPTR 和 RODATA 两 个 标志 (多 个 标志 之 间 采 
AFTA) ， 表 示 变 量 中 没有 指针 数据 同时 定义 在 只 读 代码 段 。 


变量 一 般 是 可 取 地 址 的 值 ， 但 是 const id 虽然 可 以 取 地 址 ， 但 是 确实 不 能 修改 。 不 能 修改 的 限 
制 并 不 是 由 编译 器 提供 ， 而 是 因为 对 该 变量 的 修改 会 导致 对 只 读 内 存 段 进行 写 导 致 ， 从 而 导 
致 异常 。 


| 演示 了 通过 汇编 定义 全 局 变量 的 用 法 。 但 是 实际 中 我 们 并 不 推荐 通过 汇编 定义 
语言 定义 变量 更 加 简单 。 在 Go 语言 中 定义 变量 ， 编 译 器 可 以 帮助 我 们 计算 

TRE ， 生 成 变量 的 初始 值 ， 同 时 也 包含 了 足够 的 类 型 信息 。 汇 编 语 言 的 优势 是 挖 握 
机 器 的 特性 和 性 能 ， 用 汇编 定义 变量 并 无 法 发 挥 这 些 优 势 。 因 此 在 理解 了 汇编 定义 变量 的 用 
法 后 ， 建 议 大 家 说 惯 使 用 。 








3.4. i 


终于 到 函数 了 ! 因为 Go 汇编 语言 中 ， 可 以 也 建议 通过 Go 语言 来 定义 全 局 变量 ， 那 么 剩 下 的 也 


就 是 函数 了 。 只 有 掌握 了 汇编 函数 的 基本 用 法 ， 才 能 盖 正 算是 Go 汇编 语言 入 门 。 本 章 将 简单 
讨论 Go 汇编 中 函数 的 定义 和 用 法 。 


基本 语法 


函数 标识 符 通过 TEXT 汇编 指令 定义 ， 表 示 该 行 开 始 的 指令 定义 在 TEXT 内 存 段 。TEXT 语 名 后 
的 指令 一 般 对 应 函数 的 实现 ， 但 是 对 于 TEXT 指令 本 身 来 说 并 不 关心 后 面 是 否 有 指令 。 我 个 人 
绝对 TEXT 和 LABEL 定 义 的 符号 是 类 似 的 ， 区 别 只 是 LABEL 是 用 于 跳 转 标号 ， 但 是 本 质 上 他 们 
都 是 通过 标识 符 映 射 一 个 内 存 地 址 。 


func Swap(a, b int) (int, int) 


Y Y Y 
| 


Y Y 
™ |- — 


函数 的 定义 的 语法 如 下 : 


4---- 


TEXT symbol(SB), [flags,] $framesize[-argsize] 


函数 的 定义 部 分 由 5 个 部 分 组 成 : TEXTS ^ hA ^ "T bíyflagsds ds ^ ELA i] fe 9T 36 
的 函数 参数 大 小 。 


其 中 Text 用 于 定义 函数 符号 ， 函 数 名 中 当前 包 的 路 径 可 以 省 略 。 函 数 的 名 字 后 面 是 (SB) ， 表 
示 是 相对 于 的 函数 名 符号 对 相对 于 SB 伪 寄 存 器 的 偏 移 量 ， 二 者 组 合 在 一 起 最 终 是 绝对 地 址 。 
作为 全 局 的 标识 符 的 全 局 变量 和 全 局 函数 的 名 字 一 般 都 是 基于 SB 伪 寄 存 器 的 相对 地 址 。 标 志 
部 分 用 于 指示 函数 的 一 些 特殊 行为 ， 常 见 的 NOSPLIT 主 要 用 于 指示 叶子 函数 不 进行 栈 分 裂 。 
framesize 部 分 表示 函数 的 局 部 变量 需要 多 少 栈 空间 ， 其 中 包含 调用 其 它 函 数 是 准备 调用 参数 
的 隐 式 栈 空间 。 最 后 是 可 以 省 略 的 参数 大 小 ， 之 所 以 可 以 省 略 是 因为 编译 器 可 以 从 Go 语言 的 
汐 数 声明 中 推导 出 函数 参数 的 大 小 。 


下 面 是 在 main 包 中 Add 在 汇编 中 两 种 定义 方式 : 


// func Add(a, b int) int 
TEXT main: Add(SB), NOSPLIT, $0-24 


// func Add(a, b int) int 
TEXT -Add(SB), $0 


第 一 种 是 最 完整 的 写法 : 函数 名 部 分 包含 了 当前 包 的 路 径 ， 同 时 指明 了 函数 的 参数 大 小 为 24 
个 字 节 (对 应 参数 和 返回 值 的 3 个 int 类 型 ) 。 第 二 种 写法 则 比较 简洁 ， 省 略 了 当前 包 的 路 径 和 
参数 的 大 小 。 需 要 注意 的 是 ， 标 志 参 数 中 的 NOSPLIT 如 果 在 Go 语言 函数 声明 中 通过 注释 指明 
了 标志 ， 应 该 也 是 可 以 省 略 的 (需要 确认 下 ) 。 


目前 可 能 遇 到 的 函数 函数 标志 有 NOSPLIT、WRAPPER 和 NEEDCTXT 几 个 。 其 中 NOSPLIT 

不 会 生成 或 包含 栈 分 裂 代 码 ， 这 一 般 用 于 没有 任何 其 它 兄 数 调用 的 叶子 函数 ， 这 样 可 以 适当 

提高 性 能 。WRAPPER 标 志 则 表示 这 个 是 一 个 包装 函数 ， 在 panic 或 runtime.caller 等 某 项 处 理 
函数 帧 的 地 方 不 会 增加 函数 帧 计数 。 最 后 的 NEEDCTXT 表 示 需 要 一 个 上 下 午 参 数 ， 一 般 用 于 
MERA o 


需要 注意 的 是 函数 也 没有 类 型 ， 上 面 定义 的 Add 翅 数 签名 可 以 下 面 任意 一 种 格式 : 


func Add(a, b int) int 

func Add(a, b, c int) 

func Add() (a, b, c int) 

func Add() (a []int) // reflect.SliceHeader 切片 头 刚好 也 是 3 个 int 成 员 
AR 


A ， 只 要 是 函数 的 名 字 和 参数 大 小 一 致 就 可 以 是 相同 的 函数 了 。 而 且 在 Go 汇 
编 语言 中 ， 输 入 参数 和 返回 值 参 数 是 没有 任何 的 区 别 的 。 


况 数 和 参数 和 返回 值 


对 于 有 函数 来 说 ， 最 重要 是 是 函数 对 外 提供 的 API 约 定 ， 和 包含 函 数 的 名 称 、 参 数 和 返回 值 。 当 名 
称 和 参数 返回 都 确定 之 后 ， 如 何 精确 计算 参数 和 返回 值 的 大 小 是 第 一 个 需要 解决 的 问题 。 


func Swap(a, b int) (int, int) 


call frame 


> - arg-argsize(FP) ; 
os SEN m 
ENERO 


4 -- tmp-O(SP) 
RREA ı framesize 


4-- 0(SP) 
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func Foo(a, b int) (c int) 


对 于 这 个 函数 ， 我 们 可 以 轻易 看 出 它 需 要 3 个 int 类 型 的 空间 ， 参 数 和 返回 值 的 大 小 也 就 是 24 个 
字 节 : 


TEXT .Foo(SB), $0-24 


AR A de d] A A P 51 8 33 34 4 496? 79 GO TRCP 813 — FP 43 SEES o n CSI 
帧 的 地 址 ， 也 就 是 第 一 个 参数 的 地 址 。 因 此 我 们 以 通过 +g(FP) ^ +8(FP) 和 +16(FP) 来 分 别 
引用 a、b、c 三 个 参数 。 


但 是 在 汇编 代码 中 ， 我 们 并 不 能 直接 使 用 +6(FP) 来 使 用 参数 。 为 了 编写 易于 维护 的 汇编 代 
码 ，Go 汇 编 语言 要 求 ， 任 何 通过 FP 寄 存 器 访问 的 变量 必 和 一 个 临时 标识 符 前 组 组 合 后 才能 有 
效 ， 一 般 使 用 参数 对 应 的 变量 名 作为 前 级 。 


下 面 的 代码 演示 了 如 何在 汇编 函数 中 使 用 参数 和 返回 值 : 


TEXT .Foo(SB), $0 
MOVEQ a*0(FP), AX // a 
MOVEQ b+8(FP), BX // b 
MOVEQ c*16(FP), CX // c 
RET 


如 果 是 参数 和 返回 值 类 型 比较 复杂 的 情况 改 如 何 处 理 呢 ? 下 面 我 们 再 尝试 一 个 更 复杂 的 函数 
参数 和 返回 值 的 计算 。 比 如 有 以 下 一 个 函数 : 


func SomeFunc(a, b int, c bool) (d float64, err error) int 


隙 数 的 参数 有 不 同 的 类 型 ， 同 时 含义 多 个 返回 值 ， 而且 返回 值 中 含有 更 复杂 的 接口 类 型 。 我 
们 该 如 何 计算 每 个 参数 的 位 置 和 总 的 大 小 呢 ? 


其 实 函 数 参 数 和 返回 值 的 大 小 以 及 对 齐 问题 和 结构 体 的 大 小 和 成 员 对 齐 问题 是 一 致 的 。 我 们 
先 看 看 如 果 用 Go 语言 函数 来 模拟 Foo 函 数 中 参数 和 返回 值 的 地 址 : 


func Foo(FP *struct{a, b, c int}) { 

= unsafe.Offsetof(FP.a) + uintptr(FP) // a 
= unsafe.Offsetof(FP.b) + uintptr(FP) // b 
= unsafe.Offsetof(FP.c) + uintptr(FP) // c 


- unsafe.Sizeof(*FP) // argsize 


return 


我 们 尝试 将 全 部 的 参数 和 返回 值 以 同样 的 顺序 放 到 一 个 结构 体 中 ， 将 FP 伪 寄 存 器 作为 唯一 的 
一 个 指针 参数 ， 而 每 个 成 员 的 地 址 也 就 是 对 应 原来 参数 的 地 址 。 


用 同样 的 策略 可 以 很 容易 计算 前 面 的 SomeFunc 有 阵 数 的 参数 和 返回 值 的 地 址 和 总 大 小 。 


因为 SomeFunc 函 数 的 参数 比较 多 ， 我 们 临时 定 一 个 SomeFunc_args_and_returns 结构 体 用 于 
对 应 参数 和 返回 值 : 


type SomeFunc args and returns struct { 
int 

int 

bool 

float64 

error 


ED 


然后 将 SomeFunc 原 来 的 参数 替换 为 结构 体形 式 ， 并 且 只 保留 唯一 的 FP 作 为 参数 : 
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func SomeFunc(FP *SomeFunc args and returns) { 
unsafe.Offsetof(FP.a) + uintptr(FP) 
unsafe.Offsetof(FP.b) + uintptr(FP) 


= unsafe.Offsetof(FP.c) + 
= unsafe.Offsetof(FP.d) + uintptr(FP) 
unsafe.Offsetof(FP.e) + 


uintptr(FP) 


uintptr(FP) 


unsafe.Sizeof(*FP) // argsize 


return 


// 
LA 
// 
Ju 
// 


DC 


代码 完全 和 Foo 郊 数 参 数 的 方式 类 似 。 唯 一 的 差异 是 每 个 函数 的 偏 移 量 ， 这 
有 unsafe.offsetof 函数 自动 计算 生成 。 因 为 Go 结构 体 中 的 每 个 成 员 已 经 满足 了 对 齐 要 求 ， 


因此 采 






用 通用 方式 得 到 每 个 参数 的 偏 移 量 也 是 满足 对 齐 要 求 的 。 


function arguments and return values layout 


' L-- b+2(FP) 
I--- a+O(FP) 


苞 数 中 的 局 部 变量 


unsafe.Sizeof(struct(a bool; b int16; c [Jbyte}) 


--- cData-8(FP) 


«--- o(FP) 


c.Cap4-24(FP) 


! c.Len- 16(FP) 
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从 Go 语言 函数 角度 讲 ， 局 部 变量 是 函数 内 明确 定义 的 变量 ， 同 时 也 包含 函数 的 参数 和 返回 值 
变量 。 但 是 从 Go 汇编 角度 看 ， 局 部 变量 是 指 函数 运行 时 ， 在 当前 函数 栈 帧 所 对 应 的 内 存 内 的 
变量 ， 不 包含 函数 的 参数 和 返回 值 (因为 访问 方式 有 差异 ) 。 函 数 栈 帧 的 空间 主要 由 函数 参 
数 和 返回 值 、 局 部 变量 和 被 调用 其 它 函 数 的 参数 和 返回 值 空间 组 成 。 为 了 便于 理解 ， 我 们 可 
以 将 汇编 函数 的 局 部 变量 类 比 为 Go 语言 函数 中 显 式 定义 的 变量 ， 不 包含 参数 和 返回 值 部 分 。 


function local variables 


&32(SP) , 


b30(SP) | 





| 
argsize | 
' 0i p — Óüg me MR + | 
var-O(SP) 
TREER i eCap-S(SP) 
> 4 c.Lend6(SP) 
Rs ! cData24(SP) 


fa» 





«* ---a32(SP) 


bord b 30(SP) 


framesize O(SP) !----a 32(SP) 





为 了 便于 访问 局 部 变量 ，Go 汇 编 语言 引入 了 伪 SP 寄 存 器 ， 对 应 当前 栈 帧 的 底部 。 因 为 在 当前 
栈 帧 时 间 栈 的 底部 是 国定 不 变 的 ， 因 此 局 部 变量 的 相对 于 伪 SP 的 偏 移 量 也 就 是 固定 的 ， 这 可 
以 简化 局 部 变量 的 维护 工作 。SP 申 伪 区 分 只 有 一 个 原则 : 如 果 使 用 SP 时 有 一 个 临时 标识 符 前 
缓 就 是 伪 SP， 和 否则 就 是 览 SP 寄 存 器 。 比 如 a(sP) 和 b+8(SP) 有 a 和 bb 临时 前 级 ， 这 里 都 是 伪 
SP ， 而 前 级 部 分 一 般 用 于 表示 局 部 变量 的 名 字 。 而 (sP) 和 +8(SP) 没有 临时 标识 符 作 为 前 
缓 ， 它 们 都 是 真 SP 寄存 器 。 


在 X86 平 台 ， 函 数 的 调用 栈 是 从 高 地 址 向 低地 址 增长 的 ， 因 此 伪 SP 寄 存 器 对 应 栈 帧 的 底部 其 
实 是 对 应 更 大 的 地 址 。 当 前 栈 的 顶部 对 应 趴 实 存在 的 SP 寄存 器 ， 对 应 对 应 当前 函数 栈 帧 的 栈 
底 ， 对 应 更 小 的 地 址 。 如 果 整 个 内 容 是 用 Memory 数 组 表示 ， 那 么 Memory[6(SpP):end-g(SP)] 就 
是 对 应 当前 栈 帧 的 切片 ， 其 中 开始 位 置 是 昌 SP， 结 尾部 分 是 伪 SP。 站 SP 一 般 用 于 表示 调用 
其 它 函 数 时 的 参数 和 返回 值 ， 丰 SP 对 应 内 存 较 低 的 地 址 ， 所 以 被 访问 变量 的 偏 移 量 是 正 数 ; 
而 伪 SP 对 应 高 地 址 ， 对 应 的 局 部 变量 的 偏 移 量 都 是 负数 。 


我 们 现在 Go 语言 定义 一 个 Foo 函 数 ， 并 在 函数 内 部 定义 几 个 局 部 变量 : 


3.4. 函数 232 


func Foo() { var a, b, c int } 


然后 通过 汇编 语言 重新 实现 Foo 函 数 ， 并 通过 伪 SP 来 定位 局 部 变量 : 


TEXT .Foo(SB), $24-0 
MOVQ a-8*3(SP), AX // a 
MOVQ b-8*2(SP), BX // b 
MOVQ c-8*1(SP), CX // c 
RET 


Foo 函 数 有 3 个 int 类 型 的 局 部 变量 ， 但 是 没有 调用 其 它 的 函数 ， 所 以 函数 的 栈 帧 大 小 为 24 个 字 
节 。 因 为 Foo 函 数 没 有 参数 和 返回 值 ， 因 此 参数 和 返回 值 大 小 为 0 个 字 节 ， 当 然 这 个 部 分 可 以 
省 略 不 写 。 而 局 部 变量 中 先 定 义 的 变量 a 离 为 SP 对 应 的 地 址 最 远 ， 最 后 定义 的 变量 c 里 伪 SP 最 
近 。 有 两 个 隐私 导致 出 现 这 种 逆序 的 结果 : 一 个 从 Go 语言 函数 角度 理解 ， 先 定义 的 a 变量 地 址 
要 比 后 定义 的 变量 的 地 址 更 小 ; 另 一 个 是 伪 SP 对 应 栈 帧 的 底部 ， 而 栈 是 从 高 向 地 生长 的 ， 所 
以 有 着 更 小 地 址 的 a 变 量 离 栈 的 底部 伪 SP 更 远 。 


我 们 同样 可 以 通过 结构 体 来 模拟 局 部 变量 的 布局 : 
func Foo() 1 


var local [1]struct{a, b, c int}; 
var SP = &local[1]; 


2 -(unsafe.Sizeof(local)-unsafe.Offsetof(local.a)) + uintptr(&SP) // a 
e -(unsafe.Sizeof(local)-unsafe.Offsetof(local.b)) + uintptr(&SP) // b 
= -(unsafe.Sizeof(local)-unsafe.Offsetof(local.c)) + uintptr(&SP) // c 


我 们 将 之 前 的 三 个 局 部 变量 挪 到 一 个 结构 体 中 。 然 后 构造 一 个 SP 变量 对 应 伪 SP 寄 存 器 ， 对 应 
局 部 变量 结构 体 的 顶部 。 然 后 根据 局 部 变量 总 大 小 和 每 个 变量 对 应 成 员 的 偏 移 量 计算 相对 于 
伪 SP 的 距离 ， 最 终 偏 移 量 是 一 个 负数 。 


通过 这 种 方式 可 以 处 理 复制 的 局 部 变量 的 偏 移 ， 同 时 也 能 包装 每 个 变量 地 址 的 对 齐 要 求 。 当 
然 ， 除 了 地 址 对 齐 外 ， 局 部 变量 的 布局 并 没有 顺序 要 求 。 对 于 汇编 比较 熟悉 同学 可 以 根据 字 
节 的 习惯 组 织 变量 的 布局 。 


常见 的 用 Go 汇编 实现 的 函数 都 是 叶子 函数 ， 也 就 是 被 其 它 函 数 调用 ， 但 是 很 少 调用 其 它 男 
数 。 这 主要 是 因为 叶子 函数 比较 简单 ， 可 以 简化 汇编 函数 的 编写 ; 同时 一 般 性 能 或 特性 的 瓶 
颈 也 处 于 叶子 函数 。 但 是 能 够 调用 其 它 函 数 和 能 够 被 其 它 函 数 调用 通用 重要 ， 和 否则 Go 汇编 就 
不 是 一 个 完整 的 汇编 语言 。 
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在 前 文中 我 们 已 经 学 习 过 一 些 汇编 实现 的 函数 参数 和 返回 值 处 理 的 规则 。 那 么 一 个 显然 的 问 
题 是 ， 汇 编 函 数 的 参数 是 从 哪里 来 的 ?答案 同样 明显 ， 被 调用 函数 的 参数 是 有 调用 方 准备 
的 : 调用 方 在 栈 上 设置 好 空间 和 数据 后 调用 函数 ， 被 调用 方 在 返回 前 将 返回 值 放 如 对 应 的 位 
置 ， 函 数 通过 RET 指 令 返 回调 用 放 函 数 之 后 ， 调 用 方 从 返回 值 对 应 的 栈 内 存 位 置 取 出 结果 。 
Go 语言 函数 的 调用 参数 和 返回 值 均 是 通过 栈 传输 的 ， 这 样 做 的 有 点 是 函数 调用 栈 比较 清晰 ， 
缺点 是 函数 调用 有 一 定 的 性 能 损耗 (Go 编译 器 是 通过 函数 内 联 来 缓解 这 个 问题 的 影响 ) 。 


function call frame 
«-- g.stack.hi 







func main() 
main frame 


func printsum(a, b int) 
printsum frame 
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4-- g.stack.lo 
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为 了 便于 演示 ， 我 们 先 用 Go 语言 构造 人 oo 和 bar 两 个 函数 ， 其 中 foo 有 函数 内 部 调用 bar 函 数 : 


func foo() { 
var a, b int 
bar(b) 


func bar(a int) int { 
return a 


然后 用 汇编 重新 实现 类 似 的 函数 : 


3.4. 函数 234 


TEXT .foo(SB), $32-0 
MOVQ a-8*2(SP), AX // a 
MOVQ b-8*1(SP), BX // b 


MOVQ BX, +0(SP) // bar (BX) 


CALL .bar(SB) // 
MOVQ +8(SP), CX  // CX = bar(a) 
RET 


TEXT :bar(SB), $0-16 
MOVQ a-0(FP), AX //a 


MOVQ AX, ret-8(FP) // return a 
RET 


首选 分 享 foo 兄 数 的 栈 帧 的 大 小 : foosic 34 a^ bra Em * ente Ty: RERE 
给 要 调用 的 bar 函 数 准 备 的 参数 和 返回 值 准备 16 字 节 的 空间 ， 因 此 总 共有 32 字 节 的 栈 帧 大 小 。 
在 调用 bar 函 数 前 我 们 已 经 计算 好 了 栈 帧 的 大 小 ，Go 汇 编 语言 环境 已 经 丨 实 的 SP 寄存 器 调整 
到 合适 的 大 小 ， 在 调用 函数 时 刻 并 不 需要 再 手动 调整 SP 寄存 器 。 在 调用 函数 bar 前 ， 申 SP 对 
应 向 下 增长 的 栈 顶 部 ， 因 此 顶部 的 16 个 字 节 和 bar 函 数 的 参数 和 返回 值 是 对 应 的 相同 的 内 存 空 
间 。 我 们 将 保存 了 b 只 的 BX 寄存 器 内 容 放 入 «o(sP) 位 置 ， 也 就 是 准备 bar 函 数 的 第 一 个 参数 。 
然后 通过 CALL 指 令 进 行 函 数 调用 。 在 bar 函 数 内 ， 首 先 从 第 一 个 参数 对 应 的 +6(FP) 位 置 去 除 
参数 值 存 入 AX 寄 存 器 ， 然 后 再 将 AX 内 容 放 入 返回 值 对 应 的 ret+8(FP) 内 存 位 置 ， 最 后 调用 
RET 返 回 。 在 foo 函 数 中 ， 调 用 bar 却 数 返 回 后 ， 从 bar 函 数 返 回 值 对 应 的 +8[sp) 位 置 取出 结果 
放 到 CX 寄存 ， 从 而 完成 函数 调用 。 


调用 其 它 函 数 前 调用 方 要 选择 保存 相关 寄存 器 到 栈 中 ， 并 在 调用 函数 返回 后 选择 要 恢复 的 寄 
存 器 进行 保存 。Go 语 言 中 函数 调用 时 一 个 复杂 的 问题 ， 因 为 Go 函数 不 仅仅 要 了 解 函数 调用 函 
数 的 布局 ， 还 会 涉及 到 栈 的 跳 转 ， 栈 上 局 部 变量 的 生命 周期 管理 。 本 节 只 是 简单 了 解 函数 调 
用 参数 的 布局 规则 ， 在 后 续 的 章节 中 会 更 详细 的 讨论 函数 的 细节 。 

XE E; 

宏 函 数 并 不 是 Go 汇编 语言 所 定义 ， 二 是 Go 汇编 引入 的 预 处 理 特性 自 带 的 特性 。 


在 Ci 语言 中 我 们 可 以 通过 带 参 数 的 宏 定义 一 个 交换 2 个 数 的 宏 函 数 : 


#define SWAP(x, y) do{ int t = x; x= y; y = t; }while(0) 


我 们 可 以 用 类 似 的 方式 定义 一 个 交换 两 个 寄存 器 的 宏 : 


zdefine SWAP(x, y, t) MOVQ x, t; MOVQ y, x; MOVQ t, y 


因为 汇编 语言 中 无 法 定义 临时 变量 ， 我 们 增加 一 个 参数 用 于 临时 寄存 器 。 下 面 是 通过 SWAP 


E CE ARAXATeBXEP A 8 0948 ^ IRIBGR LAE : 


// func Swap(a, b int) (int, int) 
TEXT .Swap(SB), $0-32 

MOVQ a-8*2(SP), AX // a 

MOVQ b-8*1(SP), BX // b 


SWAP(AX, BX, CX) // AX, BX - b, a 
MOVQ AX, retO-16(FP) // return 


MOVQ BX, reti*24(FP) // 
RET 


因为 预 处 理 器 可 以 通过 条 件 编译 针对 不 同 的 平台 定义 宏 的 实 


je 


现 ， 这 样 可 以 简化 平台 带 来 的 差 


3.5. 控制 流 


程序 执行 的 流程 主要 有 顺序 、 分 支 和 循环 几 种 执行 流程 。 本 节 主 要 讨论 如 何 将 Go 语言 的 控制 
流 比 较 直观 地 转译 为 汇编 程序 ， 或 者 说 如 何以 汇编 思维 来 编写 Go 语言 代码 。 


zi 
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顺序 执行 是 我 们 比较 熟悉 的 工作 模式 ， 类 似 俗 称 流水 账 编程 。 所 有 不 含 分 支 、 循 环 和 goto 语 


言 ， 并 且 每 一 递归 调用 的 Go 函数 一 般 都 是 顺序 执行 的 。 


比如 有 如 下 顺序 执行 的 代码 : 


func main() { 
var a - 10 
println(a) 


var b = (a*a)*a 
println(b) 


我 们 尝试 用 Go 汇编 的 思维 改写 上 述 函 数 。 因 为 X86 指令 中 一 般 只 有 2 个 操作 数 ， 因 此 在 用 汇编 
改写 时 要 求 出 现 的 变量 表达 式 中 最 多 只 能 有 一 个 运算 符 。 同 时 对 于 一 些 函 数 调用 ， 也 需要 该 
用 汇编 中 可 以 调用 的 函数 来 改写 。 


第 一 步 改写 依然 是 使 用 Go 语言 ， 只 不 过 是 用 汇编 的 思维 改写 : 


func main() { 
var a, b int 


a - 10 
runtime.printint(a) 
runtime.printnl() 


b-a 
b += b 
b =a 


runtime.printint(b) 
runtime.printnl() 


首选 模仿 C 语 言 的 处 理 方式 在 函数 入 口 出 声明 全 部 的 局 部 变量 。 然 后 将 根据 MOV、ADD 、 
MUL 等 指令 的 风格 ， 将 之 前 的 变量 表达 式 展 开 为 用 = 、 + 和 *= 几 种 运算 表达 的 多 个 指 
4 » iJa M runtime & 94 3$ &J printint£e printnl $ Zi 4N 4 Z iT 53 println R Zc 4r 8 2$ 7&. » 


经 过 用 汇编 的 思维 改写 ， 上 述 的 Go 函数 虽然 看 着 繁琐 了 一 点 ， 但 是 还 是 比较 容易 理解 
的 。 下 面 我 们 进 ee 数 继续 转译 为 汇编 函数 : 


TEXT .main(SB), $24-0 
MOVQ $0, a-8*2(SP) // a 
MOVQ $0, b-8*1(SP) // b 


// 将 新 的 值 写 入 a 对 应 内 存 
MOVQ $10, AX // AX - 10 
MOVQ AX, a-8*2(SP) // a = AX 


// 以 a 为 参数 调用 函数 
MOVQ AX, O(SP) 

CALL runtime.:printint 
CALL runtime:printnl 


MOVQ a-8*2(SP), AX // AX 


// 函数 调用 后 ，AX/BX 可 能 被 污染 ， 需要 重新 加 载 
=a 
MOVQ b-8*1(SP), BX // BX = b 


// 计算 b 值 ， 并 写 入 内 存 


MOVQ AX, BX // BX- AX //b-a 
ADDQ BX, BX // BX += BX // b +a 
MULQ AX, BX // BX *= AX // b *- a 


MOVQ BX, b-8*1(SP) // b - BX 


// 以 b 为 参数 调用 函数 
MOVQ BX, O(SP) 

CALL runtime:printint 
CALL runtime:printnl 


RET 


A 3: lI main £f Zi 83 4 PRATE ES UBL Xo] o E79 SER a^ brin x*: 
A 8 33 A 5 runtime: printint i Zi 4 Zi — Aint 7 JE LAA AmA * A emain $ ZC& P E3 
个 int 类 型 组 成 的 24 个 字 节 的 栈 内 存 空间 。 


在 函数 的 开始 处 先 将 变量 初始 化 为 0 值 ， 其 中 a-8*2(SP) 对 应 a 变量 、a-8*1(SP) 对 应 b 变 量 
(因为 a 变量 先 定义 ， 因 此 a 变量 的 地 址 更 小 ) o 


然后 给 a 变 量 分 配 一 个 AX 寄 存 器 ， 并 且 通 过 AX 寄 存 器 将 a 变 量 对 应 的 内 存 设置 为 10，AX 也 是 
10。 为 了 输出 a 变 量 ， 需 要 将 AX 寄 存 器 的 值 放 到 e(sP) 位 置 ， 这 个 位 置 的 变量 将 在 调用 
runtime-printint $ ZX & 1E 7j dp 印 。 因 为 我 们 之 前 已 经 将 AX 的 值 保存 到 a 变量 内 存 中 
了 ， 因 此 在 调用 郊 数 前 并 不 需要 在 进行 寄存 器 的 备份 工作 。 


在 调用 函数 返回 之 后 ， 全 部 的 寄存 器 将 被 视 为 被 调用 的 函数 修改 ， 因 此 我 们 需要 从 a、b 对 应 
的 内 存 中 重新 恢复 寄存 器 AX 和 BX。 然 后 参考 上 面 Go 语 言 中 b 变 量 的 计算 方式 更 新 BX 对 应 的 
值 ， 计 算 完成 后 同样 将 BX 的 值 写 入 到 b 对 应 的 内 存 。 


最 后 以 b 变 量 作为 参数 再 次 调用 runtime:.printint 函 数 进行 输出 工作 。 所 有 的 寄存 器 通 样 可 能 被 
污染 ， 不 过 main 马 上 就 返回 不 在 需要 使 用 AX、BX 等 寄存 器 ， 因 此 就 不 需要 再 次 恢复 寄存 器 的 
值 了 。 


重新 分 析 汇 编 改 号 后 的 整个 函数 会 发 现 里 面 很 多 的 宛 余 代码 。 我 们 并 不 需要 a、b 两 个 临时 变 
量 分 配 两 个 内 存 空间 ， 而 且 也 不 需要 在 每 个 寄存 器 变化 之 后 都 要 写 入 内 存 。 下 面 是 经 过 优化 
的 汇编 函数 : 


TEXT .main(SB), $16-0 
// var temp int 


// 将 新 的 值 写 入 a 对 应 内 存 
MOVQ $10, AX // AX = 10 
MOVQ AX, temp-8(SP) // temp - AX 


// 以 Ba 为 参数 调用 函数 
CALL runtime:printint 


CALL runtime:printnl 


// 函数 调用 后 ， AX 可 能 被 污染 ， 需要 重新 加 载 
MOVQ temp-8*1(SP), AX // AX = temp 


// 计算 b 值 ， 不 需要 写 入 内 存 


MOVQ AX, BX // BX- AX //b-a 
ADDQ BX, BX // BX += BX // b +a 
MULQ AX, BX // BX *= AX // b *- a 
Ah 


首先 是 将 main 函 数 的 栈 帧 大 小 从 24 字 闻 减 少 到 16 字 节 。 唯 一 需要 保存 的 是 a 变量 的 值 ， 因 此 
在 调用 runtime-printint 部 数 输出 时 全 部 的 寄存 器 都 可 能 被 污染 ， 我 们 无 法 通过 寄存 器 备份 a 变 
量 的 值 ， 只 有 在 栈 内 存 中 的 值 才 是 安全 的 。 然 后 在 BX 寄存 器 并 不 需要 保存 到 内 存 。 其 它 部 分 
的 代码 基本 保持 不 变 。 


if/goto 跳 转 


早期 的 Go 虽然 提供 了 goto 语 句 ， 但 是 并 不 推荐 在 编程 中 使 用 。 有 一 个 和 cgo 类 似 的 原则 : 如 果 
可 以 不 使 用 goto 语 多， 那么 就 不 要 使 用 goto 语 句 。Go 语 言 中 的 goto 语 多 是 有 严格 限制 的 : 它 
无 法 跨越 代码 块 ， 并 且 在 被 跨越 的 代码 中 不 能 含义 变量 定义 的 语句 。 虽 然 Go 语 言 不 喜欢 


goto， 但 是 goto 确 实 每 个 汇编 语言 码 农 的 最 爱 。goto 近 似 等 价 于 汇编 语言 中 的 无 条 件 跳 转 指令 
JMP， 配 合 if 条 件 goto 就 组 成 了 有 条 件 跳 转 指令 ， 而 有 条 件 跳 转 指 令 正 是 构建 整个 汇编 代码 控 
制 流 的 基石 。 


为 了 便于 理解 ， 我 们 用 Go 语言 构造 一 个 模拟 三 元 表达 式 的 上 [函数 : 
func If(ok bool, a, b int) int { 


if ok ( return a } else ( return b } 


} 


比如 求 两 个 数 最 大 值 的 三 元 表 
语言 的 限制 ， 用 来 模拟 三 元 表 
使 用 会 繁琐 一 些 ) 。 


ik A (a»b)?a:b 用 If 函数 可 以 这 样 表 达 : If(azb，a，b) ° AX 

达 式 的 {元 数 不 支 持 范 型 (可 以 将 a、b 和 返回 类 型 改 为 空 接口 ， 
这 个 函数 虽然 看 似 只 有 简单 的 一 行 ， 但 是 包含 了 if 分 支 语 句 。 在 改 用 汇编 实现 前 ， 我 们 还 是 先 
用 汇编 的 思维 来 重 写 If 函数 。 在 改写 时 同样 要 遵循 每 个 表达 式 只 能 有 一 个 运算 符 的 限制 ， 同 时 
if 语句 的 条 件 部 分 必须 只 有 一 个 比较 符号 组 成 ，if 语 句 的 body 部 分 只 能 是 一 个 goto 语 名 。 


用 汇编 思维 改写 后 的 If 元 数 实现 如 下 : 
func If(ok int, a, b int) int { 


if ok == © { goto L } 
return a 


return b 


因为 汇编 语言 中 没有 bool 类 型 ， 我 们 改 用 int 类 型 代替 bool 类 型 ( 监 实 的 汇编 是 用 byte 表 示 bool 
类 型 ， 可 以 通过 MOVBQZX 指 令 加 载 byte 类 型 的 值 ) 。 当 ok 参数 非 0 时 返回 变量 a， 和 否则 返回 

变量 b。 我 们 将 ok 的 逻辑 反 转 下 : 当 ok 参 数 为 0 时 ， 表 示 返 回 D， 否 则 返回 变量 a。 在 if 语句 中 ， 
当 Ok 参 数 为 0 时 goto 到 | 标号 指定 的 语句 ， 也 就 是 返回 变量 Db。 如 果 if 条 件 不 满足 ， 也 就 考试 ok 
残 非 0， 执 行 后 门 的 语句 返回 变量 a 。 


上 述 函 数 的 实现 已 经 非常 接近 汇编 语言 ， 下 面 是 改 为 汇编 实现 的 代码 : 


TEXT -If(SB), NOSPLIT, $0-32 
MOVQ ok*8*0(FP), CX // ok 
MOVQ a*8*1(FP), AX // a 
MOVQ b-8*2(FP), BX // b 


CMPQ CX, $0 // test ok 

JZ L // if ok == ©, skip 2 line 
MOVQ AX, ret+24(FP) // return a 

RET 


MOVQ BX, ret+24(FP) // return b 
RET 


首选 是 将 三 个 参数 加 载 到 寄存 器 中 ，ok 参 数 对 应 CX 寄 存 器 ，a、b 分 别 对 应 AX、BX 寄 存 器 。 
然后 使 用 CMPQ 比 较 指令 将 CX 寄 存 器 和 常数 0 进行 比较 。 如 果 比 较 的 结果 为 0， 那 么 下 一 条 JZ 
为 0 时 跳 转 指令 将 跳 转 到 L 标 号 对 应 的 指令 ， 也 就 是 返回 变量 b 的 值 。 如 果 比 较 的 结果 不 为 0， 
那么 JZ 指 令 讲 没 有 效果 ， 继 续 执 行 后 的 指令 ， 也 就 是 返回 变量 a 的 值 。 


在 跳 转 指令 中 ， 跳 转 的 目标 一 般 是 通过 一 个 标号 表示 。 不 过 在 有 些 通过 宏 实 现 的 函数 中 ， 更 
希望 通过 相对 位 置 跳 转 ， 这 时 候 可 以 通过 PC 寄存 器 的 来 计 草 跳 转 的 位 置 。 


for4é& Xf 


Go 语言 的 for 循 环 有 多 种 用 法 ， 我 们 这 里 只 选择 最 经 典 的 for 结 构 来 讨论 。 经 典 的 for 循 环 由 初始 
化 、 结 束 条 件 、 迭 代步 长 三 个 部 分 组 成 ， 再 配合 循环 体内 部 的 if 条 件 语言 ， 这 种 for 结 构 可 以 模 
拟 其 它 各 种 循环 类 型 。 


基于 经 典 的 for 循 环 结构 ， 我 们 定 一 个 一 个 LoopAdd 函 数 ， 可 以 用 于 计算 任意 等 差 数 列 的 和 : 


func LoopAdd(cnt, vO, step int) int { 
result := vO 
for i:-0;ic«cnt; tt 
result += step 


} 


return result 


比如 1+2+...+100 可 以 这 样 计算 LoopAdd(199，1，1) ， 10+8+...+0 可 以 这 样 计算 LoopAdd(5， 
10, -2) 。 现 在 采用 前 面 if/goto 类 似 的 技术 来 改造 for 循 环 。 


3t 4 LoopAdd £i Zt R A if/goto3& 4] 44 5X : 


func LoopAdd(cnt, vO, step int) int ( 
vari- 0 
var result = 0 


LOOP BEGIN: 
result = vO 


LOOP IF: 
if i < cnt { goto LOOP BODY } 
goto LOOP END 


LOOP BODY 
I= irl 
result = result + step 
goto LOOP_IF 


LOOP_END: 


return result 
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代步 长 三 个 部 分 拆 分 为 三 个 代码 段 ， 分 别 用 LOOP_BEGIN、LOOP IF ^ LOOP BODY - ^is 
号 表示 。 其 中 LOOP _BEGIN 循 环 初始 化 部 分 只 会 执行 一 次 ， 因 此 该 标号 并 不 会 被 引用 ， 可 以 
省 略 。 最 后 LOOP_END 语 名 表示 for 循 环 的 结束 。 四 个 标号 分 隔 出 的 三 个 代码 段 分 别 对 应 for 特 
环 的 初始 化 语句 、 循 环 条 件 和 循环 体 ， 其 中 迭代 语句 被 合并 到 循环 体 中 了 。 


下 面 用 汇编 语言 重新 实现 LoopAdd 函 数 


// func LoopAdd(cnt, vO, step int) int 
TEXT :LoopAdd(SB), NOSPLIT, $0-32 
MOVQ cnt-O(FP), AX  // cnt 
MOVQ vO-8(FP), BX // Nv0/result 
MOVQ step+16(FP), CX // step 


LOOP. BEGIN: 
MOVQ $0, DX //i 
LOOP IF: 
CMPQ DX, AX // compare i, cnt 
JL LOOP BODY // if i « cnt: goto LOOP BODY 


goto LOOP END 


LOOP BODY: 
ADDQ $1, DX // i++ 
ADDQ CX, BX // result += step 


goto LOOP IF 
LOOP END: 


MOVQ BX, ret-24(FP) // return result 
RET 


其 中 v0 和 [result 交 量 复 用 了 一 个 BX 寄存 器 。 在 LOOP_BEGIN 标 号 对 应 的 指令 部 分 ， 用 MOVQ 
将 DX 寄存 器 初始 化 为 0，DX 对 应 变量 1， 循环 的 迭代 变量 。 在 LOOP_IF 标 号 对 应 的 指令 部 分 ， 
使 用 CMPQ 指 令 比 较 AX 和 AX， 如 果 循 环 没有 结束 则 跳 转 到 LOOP_BODY 部 分 ， 否 则 跳 转 到 
LOOP_END 部 分 结束 循环 。 在 LOOP_BODY 部 分 ， 更 新 迭代 变量 并 且 执行 循环 体 中 到 累加 语 
名 ， 然 后 直接 跳 转 到 LOOP IF 部 分 进入 下 一 轮 循环 条 件 判断 。LOOP_END 标 号 之 后 就 是 返回 
返回 累加 结果 到 语句 。 


循环 是 最 复杂 到 控制 流 ， 循 环 中 隐 含 了 分 支 和 跳 转 语句 。 掌 握 了 循环 到 下 方 基本 也 就 掌握 了 
汇编 语言 到 写法 。 掌 握 规 律 之 后 ， 其 实 汇编 语 言 编程 会 变 得 异常 简单 。 


3.6. 再 论 函 数 


在 前 面 的 章节 中 我 们 已 经 简单 讨论 过 Go 的 汇编 函数 ， 但 是 那些 主要 是 叶子 函数 。 叶 子 函 数 的 
最 大 特点 是 不 会 调用 其 他 函数 ， 也 就 是 栈 的 大 小 是 可 以 预期 的 ， 叶 子 函 数 也 就 是 可 以 基本 忽 
略 爆 栈 的 问题 (如 果 已 经 爆 了 ， 那 也 是 上 级 函数 的 问题 ) 。 如 果 没 有 爆 栈 问题 ， 那 么 也 就 是 
不 会 有 栈 的 分 裂 问题 ; 如 果 没 有 栈 的 分 裂 也 就 不 需要 移动 栈 上 的 指针 ， 也 就 不 会 有 栈 上 指针 
管理 的 问题 。 但 是 是 现实 中 Go 语言 的 函数 是 可 以 任意 深度 调用 的 ， 永 远 不 用 担心 爆 栈 的 风 
险 。 那 么 这 些 近似 黑 科 技 的 特殊 是 如 何 通过 低级 的 汇编 语言 实现 的 呢 ? 这 些 都 是 本 节 尝 试 讨 


论 的 问题 。 


递归 函数 : 1 到 n 求 和 


递归 函数 是 比较 特殊 的 函数 ， 递 归 有 函数 通过 调用 自身 并 且 在 栈 上 保存 状态 ， 这 可 以 简化 很 多 

问题 的 处 理 。Go 语 言 中 递归 函数 的 强大 之 处 是 不 用 担心 爆 栈 问题 ， 因 为 栈 可 以 根据 需要 进行 
扩容 和 收缩 。 我 们 现在 尝试 通过 汇编 语言 实现 一 个 递归 调用 的 函数 ， 为 了 简化 目前 先 不 考虑 

栈 的 变化 。 


先 通 过 Go 递归 函数 实现 一 个 1 到 n 的 求 和 函数 : 


// sum - 1*2*...*n 
// sum(100) = 5050 
func sum(n int) int { 
if n» 0 ( return nrsum(n-1) } else { return oy 


} 


然后 通过 if/goto 构 型 重新 上 面 的 递归 函数 ， 以 便于 转 义 为 汇编 版 本 : 


func sum(n int) (result int) { 
var AX - n 
var BX int 


if n > 9 { goto L STEP TO END } 
goto L END 


L STEP TO END: 


AX -= 1 
BX = sum(AX) 
AX = n // 调用 函数 后 ， AX 重 新 恢复 为 n 
BX += AX 
return BX 
L_END: 
return OQ 


} 


在 改写 之 后 ， 递 归 调 用 的 参数 需要 引入 局 部 变量 ， 保 存 中 间 结 果 也 需要 引入 局 部 变量 。 而 通 
过 栈 来 保存 中 间 的 调用 状态 正 是 递归 函数 的 核心 。 因 为 输入 参数 也 在 栈 上 ， 因 为 我 们 可 以 通 
过 输入 参数 来 保存 少量 的 状态 。 同 时 我 们 模拟 定义 了 AX 和 BX 寄 存 器 ， 寄 存 器 在 使 用 前 需要 初 
始 化 ， 并 且 在 函数 调用 后 也 需要 重新 初始 化 。 


下 面 继 续 改造 为 汇编 语言 版 本 : 


// func sum(n int) (result int) 

TEXT :sum(SB), NOSPLIT, $16-16 
MOVQ n+0(FP), AX //n 
MOVQ result-*8(FP), BX // result 


CMPQ AX, $0 // test n - 0 
JG L STEP TO END // if » 0: goto L STEP TO END 
JMP L END // goto L STEP TO END 


L STEP TO END: 


SUBQ $1, AX // AX -= 1 
MOVQ AX, O(SP) // arg: n-1 
CALL :sum(SB) // call sum(n-1) 
MOVQ 8(SP), BX // BX = sum(n-1) 
MOVQ n+0(FP), AX // AX = n 
ADDQ AX, BX // BX *- AX 
MOVQ BX, result-8(FP) // return BX 
RET 

L END: 
MOVQ $0, result-8(FP) // return 0 
RET 


在 汇编 版 本 函数 中 并 没有 定义 局 部 变量 ， 只 有 用 于 调用 自身 的 临时 栈 空间 。 因 为 函数 本 身 的 
参数 和 返回 值 有 16 个 字 节 ， 因 此 栈 帧 的 大 小 也 为 16 字 节 。L_STEP TO_END 标 号 部 分 用 于 处 
理 递 归 调 用 ， 是 函数 比较 复杂 的 部 分 。L_END 用 于 处 理 递 归 终 结 的 部 分 。 


调用 sum 函数 的 参数 在 o(sP) 位 置 ， 调 用 结束 后 的 返回 值 在 8(SP) 位 置 。 在 函数 调用 之 后 要 
需要 重新 为 需要 的 寄存 器 注入 值 ， 因 为 被 调用 的 函数 内 部 很 可 能 会 破坏 了 寄存 器 的 状态 。 同 
时 调用 函数 的 参数 值 也 可 信任 的 ， 输 入 参数 也 可 能 在 被 调用 有 函数 内 部 被 修改 了 值 。 


总 得 来 说 用 汇编 实现 递归 函数 和 普通 函数 并 没有 什么 区 别 ， 当 然 是 在 没有 考虑 爆 栈 的 前 提 
下 。 我 们 的 函数 应 该 可 以 对 较 小 的 n 进 行 求 和 ， 但 是 当 n 大 到 一 定 层 度 ， 也 就 是 栈 达 到 一 定 的 
深度 ， 必 然 会 出 现 爆 栈 的 问题 。 爆 栈 是 C 语 言 的 特性 ， 不 应 该 在 哪怕 是 Go 汇编 语言 中 出 现 。 


栈 的 扩容 和 收缩 


Go 语言 的 编译 器 在 生成 函数 的 机 器 代码 时 ， 会 在 开头 插入 以 小 段 代 码 。 插 入 的 代码 可 以 做 很 
多 事情 ， 包 括 触 发 runtime.Gosched 进 行 协作 式 调度 ， 还 包括 栈 的 动态 增长 等 。 其 实 栈 等 扩容 
工作 主要 在 runtime 包 的 runtime:morestack_noctxt 骂 数 实现 ， 这 是 一 个 底层 函数 ， 只 有 汇编 层 
面 才 可 以 调用 。 


在 新 版 本 的 sum 汇编 函数 中 ， 我 们 在 开头 和 末尾 都 引入 了 部 分 代码 : 


// func sum(n int) int 
TEXT :sum(SB), $16-16 
NO LOCAL POINTERS 


L START: 
MOVQ TLS, CX 
MOVQ OG(CX)(TLS*1), AX 
CMPQ SP, 16(AX) 
JLS L MORE STK 


// 原来 的 代码 


L MORE STK: 
CALL runtime:morestack noctxt(SB) 
JMP L START 


X PNO LOCAL POINTERS 表 示 没 有 局 部 指针 。 因 为 新 引入 的 代码 可 能 导致 调用 
runtime:morestack_noctxt 函 数 ， 而 栈 的 扩容 必然 要 涉及 函数 参数 和 局 部 编 指 针 的 调整 ， 如 果 
缺少 局 部 指针 信息 将 导致 扩容 工作 无 法 进行 。 不 仅仅 是 栈 的 扩容 需要 函数 的 参数 和 局 部 指针 
标记 表格 ， 在 GC 进 行 垃圾 回收 时 也 将 需要 。 函 数 的 参数 和 返回 值 的 指针 状态 可 以 通过 在 Go 语 
言 中 的 函数 声明 中 获取 ， 函 数 的 局 部 变量 则 需要 手工 指定 。 因 为 手工 指定 指针 表格 是 一 个 非 
常 繁琐 的 工作 ， 因 此 一 般 要 避免 在 手写 汇编 中 出 现 局 部 指针 。 


喜欢 深究 的 读者 可 能 会 有 一 个 问题 : 如 果 进 行 垃圾 回收 或 栈 调 整 时 ， 寄 存 器 中 的 指针 时 如 何 
维护 的 ? 前 文 说 过 ，Go 语 言 的 函数 调用 时 通过 栈 进 行 传递 参数 的 ， 并 没有 使 用 寄存 器 传递 参 
数 。 同 时 函数 调用 之 后 所 有 的 寄存 器 视 为 失效 。 因 此 在 调整 和 维护 指针 时 ， 只 需要 扫描 内 存 
中 的 指针 数据 ， 寄 存 器 中 的 数据 在 垃圾 回收 器 函数 返回 后 都 需要 重新 加 载 ， 因 此 寄存 器 是 不 
需要 扫描 的 。 


在 Go 语言 的 Goroutine 实 现 中 ， 每 个 TIS 线 程 局 部 变量 会 保存 当前 Goroutine 的 信息 结构 体 的 指 
针 。 通 过 MovQ TLS, cx 和 MovQ 9(CX)(TLS*1)，AX 两 条 指令 将 表示 当前 Goroutine 信 息 的 g 结 构 
体 加 载 到 CX 寄 存 器 。 g 结 构 体 在 $GOROOT/src/runtime/runtime2.go 文件 定义 ， 开 头 的 结构 成 员 
如 下 : 


type g struct { 
// Stack parameters. 
// stack describes the actual stack memory: [stack.lo, stack.hi). 
// stackguardO is the stack pointer compared in the Go stack growth prologue. 
// It is stack.lo«StackGuard normally, but can be StackPreempt to trigger a preemptio 
// stackguardi is the stack pointer compared in the C stack growth prologue. 





// It is stack.lo«StackGuard on go and gsignal stacks. 

// It is -0 on other goroutine stacks, to trigger a call to morestackc (and crash). 
stack stack // offset known to runtime/cgo 

stackguardO uintptr // offset known to liblink 





stackguardi uintptr // offset known to liblink 


} 


第 一 个 成 员 是 stack 类 型 ， 表 示 当 前 栈 的 开始 和 结束 地 址 。stack 的 定义 如 下 : 





// Stack describes a Go execution stack. 
// The bounds of the stack are exactly [lo, hi), 
// with no implicit data structures on either side. 
type stack struct { 
lo uintptr 
hi uintptr 


在 g 结 构 体 中 的 stackguard0 成 员 是 出 现 爆 栈 前 的 警戒 线 。stackguard0 的 偏 移 量 是 16 个 字 节 ， 
因此 上 述 代码 中 的 cMPQ spP，16(AX) 表示 将 当前 的 夏 实 SP 和 爆 栈 警戒 线 比较 ， 如 果 超 出 警戒 
线 则 表示 需要 进行 栈 扩容 ， 也 就 是 跳 转 到 L_MORE STK» &L MORE _STK 标 号 处 ， 线 调用 
runtime"morestack_noctxt 进 行 栈 扩容 ， 然 后 又 跳 回 到 六 数 到 开始 位 置 ， 此 时 此 刻 函 数 到 栈 已 
经 调整 了 。 然 后 再 进行 一 次 栈 大 小 到 检测 ， 如 果 依 然 不 足 则 继续 扩容 ， 直 到 栈 足 够 大 为 止 。 


以 上 是 栈 的 扩容 ， 但 是 栈 到 收缩 是 在 何 时 处 理 到 呢 ? 我 们 知道 Go 运行 时 会 定期 进行 垃圾 回收 
操作 ， 这 其 中 栈 的 回收 工作 。 如 果 栈 使 用 到 比例 小 于 一 定 到 ， 则 分 配 一 个 较 小 到 栈 空 
间 ， 然 后 将 栈 上 面 到 数据 移动 到 新 的 栈 中 ， 栈 移动 的 过 程 和 栈 扩 容 的 过 程 类 似 。 


PCDATA 和 FUNCDATA 


0 语言 中 有 个 runtime.Caller 函 数 可 以 获取 当前 函数 的 调用 者 列表 。 我 们 可 以 非常 容易 在 运行 
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精确 定位 代码 的 位 置 。 


比如 以 下 代码 可 以 打印 程序 的 启动 流程 : 


func main() { 
for skip := 90; ; Skip++ { 


pc, file, line, ok :- runtime.Caller(skip) 
if !ok ( 
break 
} 
p := runtime.FuncForPC(pc) 


fnfile, fnline := p.FileLine(9) 


fmt.Printf("skip = %d, pc = 0x9608X*n", skip, pc) 
fmt.Printf(" func: file = %s, line = L%03d, name = %s, entry = 0x%08X\n", fnfile 
fmt.Printf(" call: file - 9?ss, line = L9*:93d^n", file, line) 





其 中 runtime.Caller 先 获取 当时 的 PC 寄存 器 值 ， 以 及 文件 和 行 号 。 然 后 根据 PC 寄存 器 表示 的 
指令 位 置 ， 通 过 runtime.FuncForPC 元 数 获取 浮 数 的 基本 信息 。Go 语 言 是 如 何 实现 这 种 特性 
的 呢 ? 


Go 语言 作为 一 终 静 态 编译 型 语言 ， 在 执行 时 每 个 函数 的 地 址 都 是 固定 的 ， 辑 数 的 每 条 指令 也 
时 国定 的 。 如 果 针 对 每 个 函数 和 函数 的 每 个 指令 生成 一 个 地 址 表格 〈 也 叫 PC 表 格 ) ， 那 么 在 
运行 时 我 们 就 可 以 根据 PC 寄存 器 的 值 轻松 查询 到 指令 当时 对 应 的 函数 和 位 置信 息 。 而 Go 语言 
也 时 采用 类 似 的 策略 ， 只 不 过 地 址 表格 经 过 裁剪 ， 含 育 了 不 必要 的 信息 。 因 为 要 在 运行 时 获 
取 任 意 一 个 地 址 的 位 置 ， 必 然 是 要 有 一 个 函数 调用 ， 因 此 我 们 只 需要 为 函数 的 开始 和 结束 位 
置 ， 以 及 每 个 函数 调用 位 置 生 成 地 址 表格 就 可 以 了 。 同 时 地 址 是 有 大 小 顺序 的 ， 在 排序 后 可 
以 通过 只 记录 增 量 来 减少 数据 的 大 小 ; 在 查询 时 可 以 通过 二 分 法 加 快 查找 的 速度 。 


在 汇编 中 有 个 PCDATA 用 于 生成 PC 表格 ，PCDATA 的 指令 用 法 为 : PCDATA tableid, 
tableoffset 。PCDATA 有 个 两 个 参数 ， 第 一 个 参数 为 表格 的 类 型 ， 第 二 个 是 表格 的 地 址 。 在 
目前 的 实现 中 ， 有 PCDATA_StackMaplndex 和 PCDATA_InlTreelndex 两 种 表格 类 型 。 两 种 表 
格 的 数据 是 类 似 的 ， 应 该 包含 了 代码 所 在 的 文件 路 径 、 行 号 和 函数 的 信息 ， 只 不 过 
PCDATA_InITreelndex 用 于 内 内 联 函 数 的 表格 。 


此 外 对 于 汇编 函数 中 返回 值 包含 指针 的 类 型 ， 在 返回 值 指针 被 初始 化 之 后 需要 执行 一 个 
GO RESULTS INITIALIZED 指 令 : 


#define GO RESULTS INITIALIZED PCDATA $PCDATA StackMapIndex, $1 


GO RESULTS INITIALIZED 记 录 的 也 是 PC 表格 的 信息 ， 表 示 PC 指 针 越过 某 个 地 址 之 后 返回 
值 才 完成 被 初始 化 的 状态 。 


Go 语言 二 进 制 文件 中 除了 有 PC 表格 ， 还 有 FUNC 表 格 用 于 记录 函数 的 参数 、 局 部 变量 的 指针 
言 息 。FUNCDATA 指 令 和 PCDATA 的 格式 类 似 : FUNCDATA tableid, tableoffset ， 第 一 个 参 
数 为 表格 的 类 型 ， 第 二 个 是 表格 的 地 址 。 目 前 的 实现 中 定义 了 三 种 FUNC 表 格 类 型 : 
FUNCDATA ArgsPointerMaps & 7 $ Zt 4 Zik 85 48 4118 8 X > FUNCDATA LocalsPointerMaps 
表示 局 部 指针 信息 表 ，FUNCDATA_InlTree 表 示 被 内 联展 开 的 指针 信息 表 。 通 过 FUNC 表 格 ， 
Go 语言 的 垃圾 回收 器 可 以 跟踪 全 部 指针 的 生命 周期 ， 同 时 根据 指针 指向 的 地 址 在 是 否 被 移动 
的 栈 范 围 来 确定 是 否 要 进行 指针 移动 。 


在 前 面 递归 函 数 的 例子 中 ， 我 们 遇 到 一 个 NO_LOCAL POINTERS 宏 。 它 的 定义 如 下 : 
#define FUNCDATA ArgsPointerMaps 0 /* garbage collector blocks */ 


#define FUNCDATA LocalsPointerMaps 1 
zdefine FUNCDATA InlTree 2 


4define NO LOCAL POINTERS FUNCDATA $FUNCDATA LocalsPointerMaps, runtime:no pointers stack 





JXENO LOCAL _POINTERS 宏 表示 的 是 FUNCDATA_LocalsPointerMaps 对 应 的 局 部 指针 表 
格 ， 而 runtime'no_pointers_stackmap 是 一 个 空 的 指针 表格 ， 也 就 是 表示 函数 没有 指针 类 型 的 


PCDATA 和 FUNCDATA 的 数据 一 般 是 由 编译 器 自动 生成 的 ， 手 工 编 写 并 不 现实 。 如 果 函 数 已 
经 有 Go 语言 声明 ， 那 么 编译 器 可 以 自动 输出 参数 和 返回 值 的 指针 表格 。 同 时 所 有 的 函数 调用 
一 般 是 对 应 CALL 指 令 ， 编 译 器 也 是 可 以 辅助 生成 PCDATA 表 格 的 。 编 译 器 唯一 无 法 自动 生成 
是 函数 局 部 变量 的 表格 ， 因 此 我 们 一 般 要 在 汇编 函数 的 局 部 变量 中 说 惯 使 用 指针 类 型 。 

对 于 PCDATA 和 FUNCDATA 细 节 敢 兴趣 的 同学 可 以 尝试 从 debug/gosym 包 入 手 ， 参 考 包 的 实 
现 和 测试 代码 。 


方法 函数 
Go 语言 中 方法 函数 和 全 局 函数 非常 相似 ， 比 如 有 以 下 的 方法 : 


package main 
type MyInt int 


func (v MyInt) Twice() int { 
return int(v)*2 


} 


func MyInt_Twice(v MyInt) int { 
return int(v)*2 


} 


XT Mylnt 2! $4 Twice% ;&fe Mylnt. Twice £i Zi $5 3E 78 E so 4 —4 83 » AR t Twice4k B ds xx 
件 中 被 修饰 为 main.MyInt.Twice 名 称 。 我 们 可 以 用 汇编 实现 该 方法 函数 : 


// func (v MyInt) Twice() int 
TEXT :MyInt.Twice(SB), NOSPLIT, $0-16 
MOVQ a*0(FP), AX  // v 


MOVQ AX, AX // AX *2 2 
MOVQ AX, ret+8(FP) // return v 
RET 


不 过 这 只 是 最 多 非 指针 类 型 的 解释 函数 。 现 在 增加 一 个 接收 参数 是 指针 类 型 的 Ptr 方 法 ， 指 针 
返回 传 入 的 指针 : 


func (p *MyInt) Ptr() *MyInt ( 
return p 


j 


在 目标 文件 中 ，Ptr 方 法 名 被 修饰 为 main.(*MyInt).Ptr ， 也 就 是 对 应 汇编 中 
的 .(*MyInt).Ptr 。 不 过 在 Go 汇编 语言 中 ， 星 号 和 小 括 约 都 无 法 用 作 郊 数 名 字 ， 也 就 是 无 法 
用 汇编 直接 实现 接收 参数 是 指针 类 型 的 方法 。 


在 最 终 的 目标 文件 中 的 标识 符 名 字 中 还 有 很 多 Go 汇编 语言 不 支持 的 特殊 符号 ( 比 
如 type.string. "hello" 中 的 双 引 号 ) d 这 导致 了 无 法 通过 手写 的 汇编 代码 实现 全 部 的 特性 9 
或 许 是 Go 语言 官方 故意 限制 了 汇编 语言 的 特性 。 


3.9. 补充 说 明 


得 益 于 Go 语言 的 设计 ，Go 汇 编 语言 的 优势 也 非常 明显 : 跨 操 作 系统 、 不 同 CPU 之 间 的 用 法 也 
非常 相似 、 支 持 C 语 言 预 处 理 器 、 支 持 模块 。 同 时 Go 汇编 语言 也 存在 很 多 不 足 : 它 不 是 一 个 
独立 的 语言 ， 底 层 需要 依赖 Go 语言 甚至 操作 系统 ; 很 多 高 级 特性 很 难 通过 手工 汇编 完成 。 虽 
然 Go 语 言 官 方 尽 量 保持 Go 汇编 语言 简单 ， 但 是 汇编 语言 是 一 个 比较 大 的 话题 ， 大 到 足以 写 一 
本 Go 汇编 语言 的 教程 。 本 章 的 目的 是 让 大 家 对 Go 汇编 语言 简单 入 门 ， 在 看 到 底层 汇编 代码 的 
时 候 不 会 一 头 雾 水 ， 在 某 些 遇 到 性 能 或 禁制 的 场合 能 够 通过 Go 汇编 突破 限制 。 这 只 是 一 个 开 
始 ， 后 续 版 本 会 继续 完善 。 


第 四 章 RPC 和 Protobuf 


RPC 是 远程 过 程 调 用 的 缩写 (Remote Procedure Call) ， 通 俗 地 说 就 是 调用 远 处 的 一 

Jk o ub Ab f| JR boo doc E 也 可 能 是 同一 个 机 器 RN 
程 的 函数 ， 还 可 能 是 远 在 火星 好 奇 号 上 面 的 某 个 秘密 方法 。 因 为 RPC 涉 及 的 函数 可 能 非常 之 
远 ， 远 到 它们 之 间 说 着 完全 不 同 的 语言 ， 语 言 将 成 为 两 边 的 沟通 障碍 。 而 Protobuf 因 为 支持 多 
种 不 同 的 语言 (甚至 不 支持 的 语言 也 可 以 扩展 支持 ) ， 其 本 身 特 性 也 非常 方便 描述 服务 的 接 
口 (也 就 是 方法 列表 ) ， 因 此 非常 适合 作为 RPC 世 界 的 接口 交流 语言 。 本 章 将 讨论 RPC 的 基 
本 用 法 ， 以 及 如 何 针 对 不 同 场景 设计 自己 的 RPC 服 务 ， 以 及 围绕 Protobuf 构 造 的 更 为 庞大 的 
RPC 生 态 。 


4.1. RPC AT] 


TODO 


4.2. Protobuf 5i 4 


TODO 


4.3. protorpc 


TODO 


4.4. grpc 


TODO 


4.5. 反 向 rpc 


TODO 


4.6. ProtobufZ /& 


TODO 


4.7. 基于 pb 的 rpc 定 制 


TODO 


4.8. 补充 说 明 


TODO 


AN 


第 五 章 go 和 web 


KAMA go 在 web 开发 方面 的 现状 ， 并 以 几 个 典型 的 开源 web 框架 为 例 ， 带 大 家 深入 
web 框架 本 身 的 执行 流程 。 


同时 会 介绍 现代 企业 级 web 开发 面临 的 一 些 问题 ， 以 及 在 golang 中 如 何 面 对 ， 并 解决 这 些 
问题 。 


5.1. web 开发 简介 


由 于 golang 的 net/http 提供 了 基础 的 路 由 函数 组 合 ， 并 且 也 提供 了 丰富 的 功能 函数 。 所 以 
在 golang 社区 里 有 一 种 观点 认为 用 golang 5 api 不 需要 框架 。 其 看 法 也 存在 一 定 的 道理 ， 
如 果 你 的 项 目 路 由 在 个 位 数 ，URI 固定 且 不 通过 URI 来 传递 参数 ， 那 么 使 用 官方 库 也 就 足 
够 。 但 在 复杂 场景 下 ， 官 方 的 http 库 还 是 有 些 力 不 从 心 。 例 如 下 面 这 样 的 路 由 : 


GET /card/:id 
POST /card/:id 
DELTE /card/:id 
GET /card/:id/name 


GET /card/:id/relations 


可 见 是 否 该 用 框架 还 是 要 具体 问题 具体 分 析 的 。 
golang 的 web 框架 大 致 可 以 分 为 这 么 两 类 : 


1. router 框架 
2. mvc 类 框架 


在 使 用 哪 种 框架 上 ， 大 多 数 情况 下 都 是 看 个 人 的 喜好 和 公司 技术 人 员 的 背景 。 例 如 公司 有 很 
多 技术 人 员 是 php 出 身 ， 那 么 他 们 一 定 会 非常 喜欢 像 beego 这 样 的 框架 ， 但 如 果 公 司 有 很 多 
C 程序 员 ， 那 么 他 们 的 想法 可 能 是 越 简单 越 好 。 上 比如 很 多 大 厂 的 C 程序 员 可 能 甚至 都 会 去 用 
C 去 写 很 小 的 CGI 程序 ， 可 能 本 身 并 没有 什么 意愿 去 学 习 你 的 MVC 或 者 更 复杂 的 web 杠 

架 ， 他 们 需要 的 只 是 一 个 非常 简单 的 路 由 (其 至 连 路 由 都 不 需要 ， 只 需要 一 个 基础 的 http 协议 
处 理 库 来 帮 他 省 掉 没 什么 意思 的 体力 劳动 ) 。 


golang 的 net/http 库 提 供 的 就 是 这 样 基础 的 功能 ， 写 一 个 http echo server 只 需要 三 十 秒 。 


//brief intro/echo.go 
package main 
import (...) 


func echo(wr http.ResponseWwriter, r *http.Request) { 
msg, err :- ioutil.ReadAll(r.Body) 
if err !- nil { 
wr.Wwrite([]byte("echo error")) 


return 
} 
writeLen, err := wr.Write(msg) 
if err != nil || writeLen !- len(msg) { 
log.Println(err, "write len:", writeLen) 
} 


func main() { 
http.HandleFunc("/", echo) 
err := http.ListenAndServe(":8080", nil) 
if err !- nil { 
log.Fatal(err) 


如 果 你 30 秒 没有 完成 这 个 程序 ， 检 查 一 下 自己 的 打字 速度 是 不 是 慢 了 。 开 个 玩笑 。 这 个 例 
子 是 为 了 说 明 如 果 你 想 写 一 个 http 协议 的 小 程序 有 多 么 简单 。 如 果 你 面临 的 情况 比较 复杂 ， 
例如 几 十 个 接口 的 企业 级 应 用 ， 直 接 用 net/http 库 就 显得 不 太 合适 了 。 


我 们 来 看 看 开源 社区 中 一 个 kafka 监控 项 目 中 的 做 法 : 


//Burrow: http server.go 
func NewHttpServer(app *ApplicationContext) (*HttpServer, error) { 


server.mux.HandleFunc("/", handleDefault) 
server.mux.HandleFunc("/burrow/admin", handleAdmin) 
server.mux.Handle("/v2/kafka", appHandler(server.app, handleClusterList])) 


server.mux.Handle("/v2/kafka/", appHandler[server.app, handleKafka]) 
server.mux.Handle("/v2/zookeeper", appHandlerí[server.app, handleClusterList])) 


上 面 这 段 代 码 来 自 大 名 易 易 的 linkedin 公司 的 kafka 监控 项 目 Burrow， 没 有 使 用 任何 router 
框架 ， 只 使 用 了 net/http。 只 看 上 面 这 段 代码 似乎 非常 优雅 ， 我 们 的 项 目 里 大 概 只 有 这 五 个 简 
单 的 URI， 所 以 我 们 提供 的 服务 就 是 下 面 这 个 样子 : 


/ 
/burrow/admin 
/v2/kafka 
/N2/kafka/ 
/v2/zookeeper 


如 果 你 确实 这 么 想 的 话 就 被 骗 了 。 我 们 再 进 handleKafka 3X ^ 4k —4& 95 5 : 


func handleKafka(app *ApplicationContext, w http.ResponseWwriter, r *http.Request) (int, s 
pathParts :- strings.Split(r.URL.Path[1:], "/") 
if _, ok := app.Config.Kafka[pathParts[2]]; !ok { 
return makeErrorResponse(http.StatusNotFound, "cluster not found", w, r) 


} 
if pathParts[2] -- "" { 
// Allow a trailing / on requests 
return handleClusterList(app, w, r) 
} 
if (len(pathParts) == 3) || (pathParts[3] == "") { 
return handleClusterDetail(app, w, r, pathParts[2]) 
} 


switch pathParts[3] { 
case "consumer": 


switch { 
case r.Method == "DELETE": 
switch { 
case (len(pathParts) == 5) || (pathParts[5] == ""): 
return handleConsumerDrop(app, w, r, pathParts[2], pathParts[4]) 
default: 
return makeErrorResponse(http.StatusMethodNotAllowed, "request method not 
j 
case r.Method == "GET": 
switch { 
case (len(pathParts) == 4) || (pathParts[4] == ""): 
return handleConsumerList(app, w, r, pathParts[2]) 
case (len(pathParts) == 5) || (pathParts[5] == ""): 
// Consumer detail - list of consumer streams/hosts? Can be config info 1 
return makeErrorResponse(http.StatusNotFound, "unknown API call", w, r) 
case pathParts[5] == "topic": 
switch { 
case (len(pathParts) == 6) || (pathParts[6] == ""): 
return handleConsumerTopicList(app, w, r, pathParts[2], pathParts[4]) 
case (len(pathParts) == 7) || (pathParts[7] == ""): 
return handleConsumerTopicDetail(app, w, r, pathParts[2], pathParts[4 
H 
case pathParts[5] == "status": 
return handleConsumerStatus(app, w, r, pathParts[2], pathParts[4], faise) 
case pathParts[5] == "lag": 
return handleConsumerStatus(app, w, r, pathParts[2], pathParts[4], true) 
j 


default: 


return makeErrorResponse(http.StatusMethodNotAllowed, "request method not sup 


} 
case "topic": 
switch { 
case r.Method !- "GET": 
return makeErrorResponse(http.StatusMethodNotAllowed, "request method not sup 
case (len(pathParts) -- 4) || (pathParts[4] == ""): 
return handleBrokerTopicList(app, w, r, pathParts[2]) 
case (len(pathParts) == 5) || (pathParts[5] == ""): 
return handleBrokerTopicDetail(app, w, r, pathParts[2], pathParts[^4]) 
} 
cases ofi sets: 
// Reserving this endpoint to implement later 


return makeErrorResponse(http.StatusNotFound, "unknown API call", w, r) 


// If we fell through, return a 404 
return makeErrorResponse(http.StatusNotFound, "unknown API call", w, r) 





I: 


因为 默认 的 http 库 中 的 mux 不 支持 带 参数 的 路 由 ，Burrow 这 个 项 目 使 用 了 非常 膏 脚 的 字符 
囊 Split 和 乱七八糟 的 switch case 来 达到 自己 的 目的 ， 但 实际 上 却 让 本 来 应 该 很 集中 的 路 由 
bipes: | 散落 在 系统 的 各 处 ， 难 以 维护 和 管理 。 如 果 读 者 细心 地 看 过 这 些 代 码 之 
， 可 能 会 发 现 其 它 的 几 个 handler 函数 逻辑 上 较 简 单 ， 最 复杂 le a handleKafka 。 
Rd 系统 总 是 从 这 样 微 不 足 道 的 混乱 开始 积 少 成 多 ， 最 终 变 得 难以 收拾 。 


简单 地 来 说 ， 只 要 你 的 路 由 带 有 参数 ， 并 且 这 个 项 目的 api 数目 超过 了 10， 就 尽量 不 要 使 用 

net/http 中 默认 的 路 由 。 在 golang 开源 圈 应 用 最 广泛 的 router 是 httpRouter， 很 多 开源 的 

router 框架 都 是 基于 httpRouter 进行 一 定 程度 的 改造 。 关 于 httpRouter 路 由 的 原理 ， 会 在 本 
节 的 router 一 节 中 进行 详细 的 阐释 。 


再 来 回顾 一 下 文章 开头 说 的 ， 开 源 界 有 这 么 几 种 框架 ， 第 一 种 是 对 httpRouter 进行 简单 的 封 
装 ， 然 后 提供 定制 的 middleware 和 一 些 简单 的 小 工具 集成 比如 gin， 主 打 轻 量 ， 易 学 ， 高 性 


能 。 第 二 种 是 借 监 其 它 语言 的 编程 风格 的 一 些 MVC ep ， 例如 beego， 方 便 从 其 它 语言 迁 
f xb KP D E 决 速 上 手 ， 快速 开发 。 还 有 一 些 框 架 功 能 更 为 强大 ， 除 了 db 设计 ， 大 部 分 代 
码 直接 生成 ， 例 如 goa。 不 管 哪 种 框架 WE o 


本 章 的 内 容 除了 会 展开 讲解 router 和 middleware 的 原理 ， 还 会 以 现在 工程 界面 临 的 问题 结合 
golang 来 进行 一 些 实践 性 的 说 明 。 和 希望 没有 接触 过 相关 内 容 的 读者 能 够 有 所 受用 。 


5.2. router 请 求 路 由 


在 常见 的 web 框架 中 ，router 是 必 备 的 组 件 。golang 圈子 里 router 也 时 常 被 称 为 http 的 
multiplexer。 在 上 一 节 中 我 们 通过 对 Burrow 代码 的 简单 学 习 ， 已 经 知道 如 何 用 http 标准 库 中 
内 置 的 mux 来 完成 简单 的 路 由 功能 了 。 如 果 开发 Web 系统 对 路 径 中 带 参 数 没什么 兴趣 的 话 ， 
用 http 标准 库 中 的 mux 就 可 以 。 


restful 是 几 年 前 各 起 的 API 设计 风潮 ， 在 restful 中 使 用 了 http 标准 库 还 没有 支持 的 一 些 语 
义 。 来 看 看 restful 中 常见 的 请 求 路 径 : 

GET /repos/:owner/:repo/comments/:id/reactions 

POST /projects/:project id/columns 

PUT /user/starred/:owner/:repo 


DELETE /user/starred/:owner/:repo 


相信 聪明 的 你 已 经 猜 出 来 了 ， 这 是 github 官方 文档 中 挑 出 来 的 几 个 api iX iT ° restful 风格 的 
API 重度 依赖 请 求 路 径 。 会 将 很 多 参数 放 在 请 求 URI 中 。 除 此 之 外 还 会 使 用 很 多 并 不 那么 常 
见 的 HTTP 状态 码 ， 不 过 本 节 只 讨论 路 由 ， 所 以 先 略 过 不 谈 。 


如 果 我 们 的 系统 也 想 要 这 样 的 URI 设计 ， 使 用 标准 库 的 mux 显然 就 力不从心 了 。 


httprouter 


较 流 行 的 开源 golang web 框架 大 多 使 用 httprouter， 或 是 基于 httprouter 的 变种 对 路 由 进行 
支持 。 前 面 提 到 的 github 的 参数 式 路 由 在 httprouter 中 都 是 可 以 支持 的 。 


因为 httprouter 中 使 用 的 是 显 式 匹 配 ， 所 以 在 设计 路 由 的 时 候 需要 规避 一 些 会 导致 路 由 冲突 的 
情况 ， 例 如 : 


conflict: 
GET /user/info/:name 
GET /user/:id 


no conflict: 
GET /user/info/:name 
POST /user/:id 


简单 来 讲 的 话 ， 如 果 两 个 路 由 拥有 一 致 的 http method (14 GET/POST/PUT/DELETE) 和 请 求 
路 径 前 级 ， 且 在 某 个 位 置 出 现 了 A 路 由 是 wildcard ( 指 :id 这 种 形式 ) 参数 ，B 路 由 则 是 普通 字 
符 串 ， 那 么 就 会 发 生路 由 冲突 。 路 由 冲突 会 在 初始 化 阶段 直接 panic : 


panic: wildcard route ':id' conflicts with existing children in path '/user/:id' 


goroutine 1 [running]: 
github.com/cchi23/httprouter.(*node).insertChild(0xc4200801e0, 0xc42004fc01, 0x126b177, 0 
/Users/caochunhui/go work/src/github.com/cch123/httprouter/tree.go:256 +0x841 
github.com/cch123/httprouter.(*node).addRoute(0xc4200801e0, 0x126b171, 0x9, 0x127b668) 
/Users/caochunhui/go work/src/github.com/cchi23/httprouter/tree.go:221 +0x22a 
github.com/cch123/httprouter.(*Router).Handle(0xc42004ff38, 0x126a39b, 0x3, 0x126b171, Ox 
/Users/caochunhui/go work/src/github.com/cchi23/httprouter/router.go:262 +0xc3 
github.com/cch123/httprouter.(*Router).GET(O0xc42004ff38, 0x126b171, 0x9, 0x127b668) 
/Users/caochunhui/go work/src/github.com/cchi23/httprouter/router.go:193 +0x5e 
main.main() 
/Users/caochunhui/test/go web/httprouter learn2.go:18 +0xaf 


exit status 2 
SS 


还 有 一 点 需要 注意 ， 因 为 httprouter 考虑 到 字典 树 的 深度 ， 在 初始 化 时 会 对 参数 的 数量 进行 限 
制 ， 所 以 在 路 由 中 的 参数 数目 不 能 超过 255， 否 则 会 导致 httprouter 无 法 识别 后 续 的 参数 。 不 
过 这 一 点 上 也 不 用 考虑 太 多 ， 毕 竟 URI 是 人 设计 且 给 人 来 看 的 ， 相 信 没 有 变态 的 URI 能 在 一 
条 路 径 中 带 有 200 个 以 上 的 参数 。 





除 支持 路 径 中 的 wildcard 参数 之 外 ，httprouter 还 可 以 支持 * 号 来 进行 通 配 ， 不 过 * 号 开 
头 的 参数 只 能 放 在 路 由 的 结尾 ， 例 如 下 面 这 样 : 


Pattern: /src/*filepath 


/src/ filepath = "" 
/src/somefile.go filepath - "somefile.go" 
/src/subdir/somefile.go filepath - "subdir/somefile.go" 


这 种 设计 在 restful 中 可 能 不 太 常见 ， 主 要 是 为 了 能 够 使 用 httprouter 来 做 简单 的 http 静态 文 
件 服 务 器 。 
除了 正常 情况 下 的 路 由 支持 ，httprouter 也 支持 对 一 些 特殊 情况 下 的 回调 函数 进行 定制 ， 例 如 
404 的 时 候 : 

r := httprouter.New() 


r.NotFound = http.HandlerFunc(func(w http.Responsewriter, r *http.Request) { 
w.Write([]byte("oh no, not found")) 


}) 


或 者 内 部 panic 的 时 候 : 


r.PanicHandler = func(w http.ResponseWwriter, r *http.Request, c interface(3) 1 
log.Printf("Recovering from panic, Reason: %#v", c.(error)) 
w.WriteHeader(http.StatusInternalServerError) 
w.Write([]byte(c.(error).Error())) 


目前 开源 界 最 为 流行 (star 数 最 多 ) 的 web 框架 gin 使 用 的 就 是 httprouter 的 变种 。 


原理 


httprouter 和 众多 衍生 router 使 用 的 数据 结构 被 称 为 radix tree， 压 缩 字 典 树 。 读 者 可 能 没有 
接触 过 压缩 字典 树 ， 但 对 字典 树 trie tree 应 该 有 所 耳闻 。 下 图 是 一 个 典型 的 字典 树 结构 : 





典 树 常用 来 进行 字符 囊 检索 ， 例 如 用 给 定 的 字符 串 序列 建立 字典 树 。 对 于 目标 字符 囊 ， 只 
要 从 根 节点 开始 深度 优先 搜索 ， 即 可 判断 出 该 字符 囊 是 否 曾经 出 现 过 ， 时 间 复 杂 度 为 O(n)，n 
可 以 认为 是 目标 字符 串 的 长 度 。 为 什么 要 这 样 做 ? 字符 串 本 身 不 像 数值 类 型 可 以 进行 数值 比 
较 ， 两 个 字符 囊 对 比 的 时 间 复 杂 度 取决 于 字符 囊 长 度 。 如 果 不 用 字典 树 来 完成 上 述 功能 ， 要 
对 历史 字符 串 进行 排序 ， 再 利用 二 分 查找 之 类 的 算法 去 搜索 ， 时 间 复 杂 度 只 高 不 低 。 可 认为 

字典 树 是 一 种 空间 换 时 间 的 典型 做 法 。 


通 的 字典 权 有 一 个 比较 明显 的 缺点 ， 就 是 每 个 字母 都 需要 建立 一 个 孩子 节点 ， 这 样 会 导致 
典 树 的 层 树 比 较 深 ， 压 缩 字 典 树 相 对 好 地 平衡 了 字典 树 的 优点 和 缺点 。 下 图 是 典型 的 压缩 


普 
字 
字典 树 结构 : 







每 个 节点 上 不 只 存储 一 个 字母 了 ， 这 也 是 压缩 字典 树 中 “压缩 "的 主要 含义 。 使 用 压缩 字典 树 可 
以 减少 树 的 层 数 ， 同 时 因为 每 个 节点 上 数据 存储 也 比 通常 的 字典 树 要 多 ， 所 以 程序 的 局 部 性 
较 好 (一 个 节点 的 path 加 载 到 cache 即 可 进行 多 个 字符 的 对 比 )， 从 而 对 CPU 缓存 友好 。 


压缩 字典 树 创 建 过 


我 们 来 跟踪 一 下 httprouter 中 ， 一 个 典型 的 压缩 字典 树 的 创建 过 程 ， 路 由 设 定 如 下 : 


PUT /user/installations/:installation id/repositories/:repository id 


GET /marketplace listing/plans/ 

GET /marketplace listing/plans/:id/accounts 
GET /search 

GET /status 

GET /support 


补充 路 由 : 
GET /marketplace listing/plans/ohyes 


最 后 一 条 补充 路 由 是 我 们 腹 想 的 ， 除 此 之 外 所 有 API 路 由 均 来 自 于 api.github.com ° 


root 节点 创建 
httprouter 的 Router struct 中 存储 压缩 字典 树 使 用 的 是 下 述 数据 结构 : 


// 略 去 了 其 它 部 分 的 Router struct 
type Router struct { 

Jd aas 

trees map[string]*node 

747 a: 


trees 中 的 key FP 7j http 1.1 的 RFC 中 定义 的 各 种 method > RFRA : 


GET 
HEAD 
OPTIONS 
POST 
PUT 
PATCH 
DELETE 


每 一 种 method 对 应 的 都 是 一 棵 独立 的 压缩 字典 树 ， 这 些 树 彼 此 之 间 不 共享 数据 。 具 体 到 我 们 
上 面 用 到 的 路 由 ，PUT 和 GET 是 两 棵 树 而 非 一 棵 。 

简单 来 讲 ， 某 个 method 第 一 次 插入 的 路 由 就 会 导致 对 应 字典 树 的 根 节 点 被 创建 ， 我 们 按 顺 
序 ， 先 是 一 个 PUT : 


r := httprouter.New() 
r.PUT("/user/installations/:installation id/repositories/:reposit", Hello) 


这 样 PUT 对 应 的 根 节点 就 会 被 创建 出 来 。 把 这 棵 PUT 的 树 画 出 来 : 


path : "/user/installations/" 
wildChild: true 

nType: root 

indices: ™ 


path : "installation id" 
wildChild: false 
nType: param 
indices: "" 


path : "/repositories/" 
wildChild: true 
nType: default 
indices: ™ 


path : ":reposit" 
wildChild: false 
nType: param 
indices: "" 





radix 的 节点 类 型 为 *httprouter.node ， 为 了 说 明 方便 ， 我 们 留 下 了 目 前 关心 的 几 个 字段 : 
path: 当前 节点 对 应 的 路 径 中 的 字符 串 
wildChild: 子 节点 是 否 为 参数 节点 ， 即 wildcard node， 或 者 说 :id 这 种 类 型 的 节点 


nType: 当前 节点 类 型 ， 有 四 个 枚 举 值 : 分 别 为 static/root/param/catchAll e 


static // 非 根 节 点 的 普通 字符 串 节 点 
root // 根 节点 

param // 参数 节点 ， 例 如 :id 
catchAll // 通配符 节点 ， 例 如 *anyway 


indices: 子 节点 索引 ， 当 子 节点 为 非 参 数 类 型 ， 即 本 节点 的 wildchild 为 false 时 ， 会 将 每 个 子 节点 的 首 字母 放 
“l | >» 


当然 ，PUT 路 由 只 有 唯一 的 一 条 路 径 。 接 下 来 ， 我 们 以 后 续 的 多 条 GET 路 径 为 例 ， 讲 解 子 节 
点 的 插入 过 程 。 





子 节 点 插入 


当 插 入 GET /marketplace listing/plans 时 ， 类 似 前 面 PUT 的 过 程 ，GET 树 的 结构 如 图 所 


path : "/marketplace listing/plans/" 
wildChild : false 


nType : root 
indices : "" 





因为 第 一 个 路 由 没有 参数 ，path 都 被 存储 到 根 节点 上 了 。 所 以 只 有 一 个 节点 。 


然后 插入 GET /marketplace listing/plans/:id/accounts ， 新 的 路 径 与 之 前 的 路 径 有 共同 的 前 
缓 ， 且 可 以 直接 在 之 前 叶子 节点 后 进行 插入 ， 那 么 结果 也 很 简单 ， 插 入 后 树 变 成 了 这 样 : 


path : "/marketplace listing/plans/" 
wildChild : true 

nType : root 

indices : "" 


path : "id" 
wildChild : false 


nType : param 


indices : 


path : "/accounts" 
wildChild : false 
nType : default 
indices : "" 





由 于 :id 这 个 节点 只 有 一 个 字符 串 的 普通 子 节点 ， 所 以 indices 还 依然 不 需要 处 理 。 
上 面 这 种 情况 比较 简单 ， 新 的 路 由 可 以 直接 作为 原 路 由 的 子 节 点 进行 插入 。 实 际 情况 不 会 这 
么 美好 。 


接 下 来 我 们 播 入 GET /search ， 这 时 会 导致 树 的 边 分 裂 。 


path : "/" 
wildChild : false 
nType : root 
indices : "ms" 


path : "search" 


path : - wildChild : false 
"marketplace listing/plans/" nType : default 


wildChild : true indices : "" 
nType : default 
indices : "" 


path : ":id" 
wildChild : false 
nType : param 
indices : "" 


path : "accounts" 
wildChild : false 
nType : default 
indices : "" 





原 有 路 径 和 新 的 路 径 在 初始 的 / 位 置 发 生 分 裂 ， 这 样 需要 把 原 有 的 root 节点 内 容 下 移 ， 再 
将 新 路 由 search 同样 作为 子 节点 挂 在 root 节点 之 下 。 这 时 候 因 为 子 节点 出 现 多 个 ，root 节 
点 的 indices 提供 子 节点 索引 ， 这 时 候 该 字段 就 需要 派 上 用 场 了 。"ms'" 代表 子 节 点 的 首 字 母 
分 别 为 m(marketplace) 和 s(search) 。 


我 们 一 口 作 气 ， 把 GET /status 和 GET /support 也 插入 到 树 中 。 这 时 候 会 导致 在 search 
节点 上 再 次 发 生 分 裂 ， 来 看 看 最 终 的 结果 : 


path : "/" 
wildChild : false 


nType : root 
indices : "ms" 


pam: path : "s" 


" iet " ildChild : false 
marketplace listing/plans/ wi : 
wildChild : true niType:: default 


nType : default indices : "etu" 


indicae - "" 








: path : "earch" path : "tatus" path : "upport" 
path : ":id" wildChild : false wildChild : false wildChild : false 
wildChild : false nType : default nType : default nType : default 
nType : param indices : indices : "" indices : "" 
indices : "" 


path : "accounts" 
wildChild : false 
nType : default 
indices : "" 


子 节点 冲突 处 理 


在 路 由 本 身 只 有 字符 串 的 情况 下 ， 不 会 发 生 任何 冲突 。 只 有 当 路 由 中 含有 wildcard( 类 似 :id) 
或 者 catchAll 的 情况 下 才 可 能 冲突 。 这 一 点 在 前 面 已 经 提 到 了 。 


子 节点 的 冲 突 处 理 很 简单 ， 分 几 种 情 


1. 在 插入 wildcard 节点 时 ， 父 节点 的 children 数组 非 空 且 wildChild 被 设置 为 false » 4 
如 : GET /user/getAll fe cET /user/:id/getAddr ， 或 者 GET /user/*aaa 和 GET 
/user/:id ? 

2. 在 插入 wildcard 节点 时 ， 父 节点 的 children 数组 非 空 且 wildChild 被 设置 为 true， 但 该 父 
节点 的 wildcard 子 节点 要 插入 的 wildcard 名 字 不 一 样 。 例 如 : GET /user/:id/info 和 
GET /user/:name/info ? 

3. 在 插入 catchAll 节点 时 ， 父 节点 的 children 非 空 。 例 如 : GET /src/abc 和 GET 
/src/*filename ， 或 者 GET /src/:id 和 GET /src/*filename ° 

4. 在 插入 static 节点 时 ， 父 节点 的 wildChild 字段 被 设置 为 true。 

5. 在 插入 static 节点 时 ， 父 节点 的 children 非 空 ， 且 子 节点 nType 为 catchAll 。 


只 要 发 生 冲 突 ， 都 会 在 初始 化 的 时 候 panic 。 


5.3. middleware 中 间 件 


本 章 将 对 现在 流行 的 web 框架 中 的 中 间 件 技术 原理 进行 分 析 ， 并 介绍 如 何 使 用 中 间 件 技术 将 
业务 和 非 业 务 代 码 功 能 进行 解 耦 。 


代码 泥潭 
先 来 看 一 段 代码 : 


// middleware/hello.go 


package main 


func hello(wr http.ResponseWwriter, r *http.Request) { 
wr.Write([]byte("hello")) 


} 
func main() { 


http.HandleFunc("/", hello) 
err := http.ListenAndServe(":8080", nil) 


这 是 一 个 典型 的 Web 服务 ， 挂 载 了 一 个 简单 的 路 由 。 我 们 的 线 上 服务 一 般 也 是 从 这 样 简单 的 
服务 开始 逐渐 拓展 开 去 的 。 


现在 突然 来 了 一 个 新 的 需求 ， 我 们 想 要 统计 之 前 写 的 hello 服务 的 处 理 耗 时 ， 需 求 很 简单 ， 我 
们 对 上 面 的 程序 进行 少量 修改 : 


// middleware/hello with time elapse.go 


var logger = log.New(os.Stdout, "", 0) 


func hello(wr http.Responsewriter, r *http.Request) { 


timestart :- time.Now() 
wr.Write([]byte("hello")) 
timeElapsed := time.Since(timeStart) 


logger.Println(timeElapsed) 


这 样 便 可 以 在 每 次 接收 到 http 请 求 时 ， 打 印 出 当前 请 求 所 消耗 的 时 间 。 


完成 了 这 个 需求 之 后 ， 我 们 继续 进行 业务 开发 ， 提 供 的 api 逐渐 增加 ， 现 在 我 们 的 路 由 看 起 来 
是 这 个 样子 : 


// middleware/hello with more routes.go 
// 省 略 了 一 些 相 同 的 代码 
package main 





func helloHandler(wr http.ResponseWriter, r *http.Request) { 


func showInfoHandler(wr http.ResponseWriter, r *http.Request) ( 


func showEmailHandler(wr http.Responsewriter, r *http.Request) { 


func showFriendsHandler(wr http.ResponseWriter, r *http.Request) ( 
timestart :- time.Now() 
wr.write([]byte("your friends is tom and alex")) 
timeElapsed := time.Since(timeStart) 
logger.Println(timeElapsed) 


func main() { 
http.HandleFunc("/", helloHandler) 
http.HandleFunc("/info/show", showInfoHandler) 
http.HandleFunc("/email/show", showEmailHandler) 
http.HandleFunc("/friends/show", showFriendsHandler) 


每 一 个 handler 里 都 有 之 前 提 到 的 记录 运行 时 间 的 代码 ， 每 次 增加 新 的 路 由 我 们 也 同样 需要 把 
这 些 看 起 来 长 得 差不多 的 代码 拷贝 到 我 们 需要 的 地 方 去 。 因 为 代码 不 太 多 ， 所 以 实施 起 来 也 
没有 遇 到 什么 大 问题 。 


渐渐 的 我 们 的 系统 增加 到 了 30 个 路 由 和 handler 函数 ， 每 次 ANG handler， 我 们 的 第 一 
件 工作 就 是 把 之 前 写 的 所 有 和 业务 逻辑 无 关 的 周边 代码 先 找 贝 过 


接 下 来 系统 安稳 地 运行 了 一 段 时 间 ， 突 然 有 一 天 ， 老 板 找到 你 ， 我 们 最 近 找 人 新 开发 了 监控 

ind 为 了 系统 运行 可 以 更 加 可 控 ， 需 要 把 每 个 接口 运行 的 耗 时 数据 主动 上 报到 我 们 的 监控 

系统 里 。 给 监控 系统 起 个 名 字 吧 ， 叫 metrics。 现 在 你 需要 修改 代码 并 把 耗 时 通过 http post 的 
Mee 给 metrics 了 。 我 们 来 修改 一 下 helloHandler : 


func helloHandler(wr http.ResponseWriter, r *http.Request) { 


timestart :- time.Now() 
wr.Write([]byte("hello")) 
timeElapsed := time.Since(timeStart) 


logger.Println(timeElapsed) 
// 新 增 耗 时 上 报 


metrics.Upload("timeHandler", timeElapsed) 


修改 到 这 里 ， 本 能 地 发 现 我 们 的 开发 工作 开始 陷入 了 泥潭。 无 论 未 来 对 我 们 的 这 个 web 系统 
有 任何 其 它 的 非 功 能 或 统计 需求 ， 我 们 的 修改 必然 牵 一 发 而 动 全 身 。 只 要 增加 一 个 非常 简单 
的 非 业 务 统计 ， 我 们 就 需要 去 几 十 个 handler 里 增加 这 些 业 务 无 关 的 代码 。 虽 然 一 开始 我 们 似 
乎 并 没有 做 错 ， 但 是 显然 随 着 业务 的 发 展 ， 我 们 的 行事 方式 让 我 们 陷入 了 代码 的 泥潭。 


使 用 middleware ẹṣ) à 3E 3c 2-37 £8 


我 们 来 分 析 一 下 ， 一 开始 在 哪里 做 错 了 呢 ? 我 们 只 是 一 步 一 步 地 满足 需求 ， 把 我 们 需要 的 遥 
辑 按照 流程 写 下 去 呀 ? 


实际 上 ， 我 们 犯 的 最 大 的 错误 是 把 业务 代码 和 非 业 务 代码 揉 在 了 一 起 。 对 于 大 多 数 的 场景 来 
讲 ， 非 业务 的 需求 都 是 在 http 请 求 处 理 前 做 一 些 事情 ， 或 者 /并 且 在 响应 完成 之 后 做 一 些 事 
情 。 我 们 有 没有 办 法 使 用 一 些 重 构思 路 把 这 些 公 共 的 非 业 务 功能 代码 剥离 出 去 呢 ? 回 到 刚 开 
头 的 例子 ， 我 们 需要 给 我 们 的 helloHandler 增加 超时 时 间 统 计 ， 我 们 可 以 使 用 一 种 叫 
function adapter 的 方法 来 对 helloHandler 进行 包装 : 


func hello(wr http.Responsewriter, r *http.Request) { 


wr.Write([]byte("hello")) 


func timeMiddleware(next http.Handler) http.Handler ( 
return http.HandlerFunc(func(wr http.ResponseWriter, 


timestart :- time.Now() 


// next handler 


next.ServeHTTP(wr, r) 


timeElapsed :- time.Since(timeStart) 
logger.Println(timeElapsed) 
1) 


func main() { 
http.HandleFunc("/", timeMiddleware(hello)) 
err := http.ListenAndServe(":8080", nil) 


这 样 就 非常 轻松 地 实现 了 业务 与 非 业务 之 间 的 剥离 ， 魔 法 就 在 于 这 个 timeMiddleware。 可 以 
从 代码 中 看 到 ， 我 们 的 timeMiddleware 也 是 一 个 函数 ， 其 参数 为 http.Handler，http.Handler 


的 定义 在 net/http 包 中 : 


type Handler interface { 
ServeHTTP(ResponseWriter, *Request) 


任何 方法 实现 了 ServeHTTP， 即 是 一 个 合法 的 http.Handler， 读 到 这 里 你 可 能 会 有 一 些 混 


r *http.Request) { 


乱 ， 我 们 先 来 梳理 一 下 http 库 的 Handler * HandlerFunc 和 ServeHTTP 的 关系 : 


type Handler interface { 
ServeHTTP(ResponseWriter, *Request) 


type HandlerFunc func(ResponseWriter, *Request) 


func (f HandlerFunc) ServeHTTP(w ResponseWriter, 
f(w, r) 


实际 上 只 要 你 的 handler 函数 签名 是 : 


r *Request) 


func (ResponseWwriter, *Request) 


那么 这 个 handler 和 http.HandlerFunc 就 有 了 一 致 的 函数 签名 ， 可 以 将 该 handler 函数 进行 
类 型 转换 ， 转 为 http.HandlerFunc。 而 http.HandlerFunc 实现 了 http.Handler 这 个 接口 。 在 
http 库 需 要 调用 你 的 handler 函数 来 处 理 http 请 求 时 ， 会 调用 HandlerFunc 的 ServeHTTP 
函数 ， 可 见 一 个 请 求 的 基本 调用 链 是 这 样 的 : 


h = getHandler() => h.ServeHTTP(w, r) -» h(w, r) 


上 面 提 到 的 把 自 定义 handler 转换 为 http.HandlerFunc 这 个 过 程 是 必须 的 ， 因 为 我 们 的 
handler 没有 直接 实现 ServeHTTP 这 个 接口 。 上 面 的 代码 中 我 们 看 到 的 HandleFunc( 注 意 
HandlerFunc 和 HandleFunc 的 区 别 ) 里 也 可 以 看 到 这 个 强制 转换 过 程 : 


func HandleFunc(pattern string, handler func(ResponseWwriter, *Request)) ( 
DefaultServeMux.HandleFunc(pattern, handler) 


} 


// 调用 
// AS 


func (mux *ServeMux) HandleFunc(pattern string, handler func(ResponseWwriter, *Request)) ( 
mux.Handle(pattern, HandlerFunc(handler)) 


} 
Aoo“ 


知道 handler 是 怎么 一 回 事 ， 我 们 的 中 间 件 通过 包装 handler » 3E I — 4-35 89 handler 就 好 
理解 了 。 


总 结 一 下 ， 我 们 的 中 间 件 要 做 的 事情 就 是 通过 一 个 或 多 个 函数 对 handler 进行 包装 ， 返 回 一 个 
包括 了 各 个 中 间 件 逻辑 的 函数 链 。 我 们 把 上 面 的 包装 再 做 得 复杂 一 些 : 


customizedHandler = logger(timeout(ratelimit(helloHandler))) 


这 个 函数 链 在 执行 过 程 中 的 上 下 文 可 以 用 下 面 这 张 图 来 表示 。 
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http response 


再 直 白 一 些 ， 这 个 流程 在 进行 请 求 处 理 的 时 候 实 际 上 就 是 不 断 地 进行 函数 压 栈 再 出 栈 ， 有 一 
些 类 似 于 递归 的 执行 流 : 


[exec of logger logic] BEA: [] 

[exec of timeout logic] 函数 栈 : [logger] 

[exec of ratelimit logic] 函数 栈 : [timeout/logger] 

[exec of helloHandler logic] BAA: [ratelimit/timeout/logger] 


[exec of ratelimit logic part2] 函数 栈 : [timeout/logger] 


[exec of timeout logic part2] 函数 栈 : [logger] 
[exec of logger logic part2] EA: [] 


功能 实现 了 ， 但 在 上 面 的 使 用 过 程 中 我 们 也 看 到 了 ， 这 种 函数 套 函 数 的 用 法 不 是 很 美观 ， 同 
时 也 不 具备 什么 可 读 性 。 


更 优雅 的 middleware 写法 
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果 需 要 修改 这 些 函 数 的 顺序 ， 或 者 增删 middleware 还 是 有 点 费劲 ， 本 节 我 们 来 进行 一 些 “ 写 
法 "上 的 优化 。 


看 一 个 例子 : 


= NewRouter( ) 
.Use( logger) 


.Use(ratelimit) 


F 
- 

r.Use(timeout) 

下 

r.Add("/", helloHandler) 


通过 多 步 设 置 ， 我 们 拥有 了 和 上 一 节 差 不 多 的 执行 函数 链 。 胜 在 直观 易 懂 ， 如 果 我 们 要 增加 
或 者 删除 middleware， 只 要 简单 地 增加 删除 对 应 的 Use 调用 就 可 以 了 。 非 常 方便 。 


从 框架 的 角度 来 讲 ， 怎 么 实现 这 样 的 功能 呢 ? 也 不 复杂 : 


type middleware func(http.Handler) http.Handler 
type Router struct { 


middlewareChain [] func(http.Handler) http.Handler 
mux map[string] http.Handler 


func NewRouter() *Router{ 
return &Router() 


func (r *Router) Use(m middleware) { 
r.middlewareChain - append(r.middlewareChain, m) 


func (r *Router) Add(route string, h http.Handler) { 
var mergedHandler - h 
for i := len(r.middlewareChain) - 1; i >= 0; i-- { 


mergedHandler - r.middlewareChain[i](mergedHandler) 


r.mux[route] - mergedHandler 


注意 代码 中 的 middleware 数组 遍历 顺序 ， 和 用 户 希 望 的 调用 顺序 应 该 是 "相反 "的 。 应 该 不 难 
理解 。 


哪些 事情 适合 在 middleware 中 做 


以 较 流 行 的 开源 golang 框架 chi 79 49] : 


compress.go 

=> 对 http 的 response body 进行 压缩 处 理 
heartbeat.go 

=> 设置 一 个 特殊 的 路 由 ， 例 如 /ping，/healthcheck， 用 来 给 load balancer 一 类 的 前 置 服务 进行 探 活 
logger .go 

=> 打印 request 处 理 日 志 ， 例 如 请 求 处 理 时 间 ， 请 求 路 由 
profiler.go 

=> 挂 载 pprof 需要 的 路 由 ， 如 /pprof、/pprof/trace 到 系统 中 
realip.go 

=> 从 请 求 头 中 读 取 X-Forwarded-For 和 X-Real-IP， 将 http.Request 中 的 RemoteAddr 修改 为 得 到 的 
requestid.go 

=> 为 本 次 请 求生 成 单独 的 requestid， 可 一 路 透 传 ， 用 来 生成 分 布 式 调用 链 路 ， 也 可 用 于 在 日 志 中 串 连 单 次 请 求 的 ) 
timeout ,go 

=> 用 context.Timeout 设置 超时 时 间 ， 并 将 其 通过 http.Request 一 路 透 传 下 去 
throttler.go 

=> 通过 定 长 大 小 的 channel 存储 token， 并 通过 这 些 token 对 接口 进行 限 流 


加 


每 一 个 web 框架 都 会 有 对 应 的 middleware 组 件 ， 如 果 你 有 兴趣 ， 也 可 以 向 这 些 项 目 贡 献 有 
用 的 middleware， 只 要 合理 一 般 项 目的 维护 人 也 愿意 合并 你 的 pull request 。 





比如 开源 界 很 火 的 gin 这 个 框架 ， 就 专门 为 用 户 贡 献 的 middleware 开 了 一 个 仓库 : 
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gin-gonic / contrib © Watch ~ 





《> Code Œ Issues 22 i^ Pull requests 27 I Projects 0 Wiki Insights ~ 


Collection of middlewares created by the community https://gin-gonic.github.io/gin/ 


D 136 commits P 2 branches © 0 releases 





Branch: master v New pull request Create new file Upload files | Find file x* 


Es) appleboy committed on GitHub move casbin/gin-authz to gin-contrib/authz (#138) 


E cache [ci skip] Add EOL-warning. 

iig commonlog Add missing user identifier part 

Ea cors [ci skip] Add EOL-warning. 

B3 expvar [ci skip] update readme. 

B3 ginrus Fixed ginrus example code 

E gzip [ci skip] Add EOL-warning. 

gn jwt fixes broken tests (#124) 

83 newrelic Fixes contrib for Gin v1.0 

E renders/multitemplate add EOL warning on multitemplate package. 


如 果 读 者 去 阅读 gin 的 源码 的 话 ， 可 能 会 发 现 gin 的 middleware 中 处 理 的 并 不 是 
http.Handler， 而 是 一 个 叫 gin.HandlerFunc 的 函数 类 型 ， 和 本 节 中 讲解 的 http.Handler 签名 
并 不 一 样 。 不 过 实际 上 gin 的 handler 也 只 是 针对 其 框架 的 一 种 封装 ，middleware 的 原理 与 
本 节 中 的 说 明 是 一 致 的 。 
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5.4. validator 请 求 校 验 


社区 里 曾经 有 人 用 这 张 图 来 嘲笑 PHP : 


function rogíster() 
i 


if (lompty($ P097)) { 
$mag = ''; 
if ($ POST['user 5name']) 1 
if ($ POST['user password new']) ( 
if (9 POST['user pasoword now'] === $ POST['user password repoat']) ( 
if (strlen(f POST['usor password new']) > 5) ( 
if (strlon($ POST['user namo']) < 65 && etrlen(? POSTI Voor nomo']) > 1) ( 
if (prog match('/*[a-24](2,64)8/1', $ POST[' umor 5ame'])) ( 
$user * read usor($ POST['user namo']): 
Af (tisset(funor('unor namo'])) ( 
if ($ PoST(['user email']) ( 
if (strlon($ POST['usor emaíl']) < 65) ( 
if (filtor var($ POST['uoeer amail], PILTER VALIDATE EMAIL)) ( 
creato user()] 
$ 8T88ION['nmag') ^ 'You are now regíistored so ploase login'; 
header('Location: ' . $ SERVER('DMP SELF'])) 
oxit(); 
) elco nay = 'You must provide a valid email addresa'; 
) elso $msg 9 'Enmail must bo lonn than 64 charactorn' 
) elae $mag = 'feail cannot be empty'; 
) else $ssg = 'Uoornamo already exists') 
) else $msg = 'Usornamo muat be only a-z, A-2, 0-9'; 
) eiso $mag = 'Usernaso most bo beotvoon 2 and 64 charactors' 





) else $zsg ^ 'Pasuword must bo at least 6 charactors’; 
) else Snag = ‘Passworde do not match'; 
) else nog = 'Ecpty Paonword'; 
} el1so $msg = 'Empty Ucernamo'; 
$ SESSION['mag'] = Smag) 


) 
return register form(); 
} 
实际 上 这 是 一 个 语言 无 关 的 场景 ， 需 要 进行 字段 校 验 的 情况 有 很 多 ，web 系统 的 
提交 只 是 一 个 典型 的 例子 。 我 们 用 go POP 的 校 验 demo。 然 后 研究 怎么 一 步 步 
对 其 进行 改进 。 


重 构 请 求 校 验 函 数 


假设 我 们 的 数据 已 经 通过 某 个 binding 库 绑 定 到 了 具体 的 struct 上 。 
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type RegisterReq struct ( 


Username string "json: "username" ^ 
PasswordNew string "json:"password new" 
PasswordRepeat string ^json:"password repeat" 
Email string som semakin 


func register(req RegisterReq) error{ 
if len(req.Username) > © { 
if len(req.PasswordNew) > © && len(req.PasswordRepeat) > 6 ( 
if req.PasswordNew == req.PasswordRepeat { 
if emailFormatValid(req.Email) { 
createUser() 
return nil 
L else ( 
return errors.New("invalid email") 


} 
* else { 
return errors.New("password and reinput must be the same") 
} 
} else { 
return errors.New("password and password reinput must be longer than 0") 
} 
) else { 


return errors.New("length of username cannot be 0") 


我 们 在 golang 里 成 功 写 出 了 hadoken 开路 的 箭头 型 代码 。。 这 种 代码 一 般 怎 么 进行 优化 
呢 ? 


很 简单 ， 在 《 重 构 》 一 书 中 已 经 给 出 了 方案 : Guard Clauses。 


func register(req RegisterReq) error( 


if len(req.Username) -- 0 ( 
return errors.New("length of username cannot be 0") 
} 
if len(req.PasswordNew) == 0 || len(req.PasswordRepeat) == 0 ( 
return errors.New("password and password reinput must be longer than 0") 
} 
if req.PasswordNew != req.PasswordRepeat { 
return errors.New("password and reinput must be the same") 
} 


if emailFormatValid(req.Email) { 
return errors.New("invalid email") 


} 


createUser() 
return nil 


代码 更 清爽 ， 看 起 来 也 不 那么 别扭 了 。 这 是 比较 通用 的 重 构 理念 。 虽 然 使 用 了 重 构 方法 使 我 
们 的 validate 过 程 看 起 来 优雅 了 ， 但 我 们 还 是 得 为 每 一 个 http 请 求 都 去 写 这 么 一 套 差不多 的 
validate 函数， 有 没有 更 好 的 办 法 来 帮助 我 们 解除 这 项 体力 劳动 ?答案 就 是 validator。 


用 validator 解放 体力 劳动 


从 设计 的 角度 讲 ， 我 们 一 定 会 为 每 个 请 求 都 声明 一 个 struct。 前 文中 提 到 的 校 验 场景 我 们 都 可 
以 通过 validator 完成 工作 。 还 以 前 文中 的 struct 为 例 。 为 了 美观 起 见 ， 我 们 先 把 json tag 省 
%4? o 


这 里 我 们 引入 一 个 新 的 validator 库 : 


https://github.com/go-playground/validator 


import "gopkg.in/go-playground/validator.v9" 


type RegisterReq struct ( 


// 字符 串 的 gt=0 表示 长 度 必 须 > 0，gt = greater than 
Username String "validate:"gt-0"^ 
717 dass 
PasswordNew string "validate:"gt-0""^ 
// egfield 跨 字 段 相 等 校 验 
PasswordRepeat string `validate:"eqfield=PasswordNew" ` 
// 合法 email 格式 校 验 
Email string "validate: "email" 
H 
func validate(req RegisterReq) error ( 
err :- validate.Struct(mystruct) 
if err !- nil ( 


doSomething() 


这 样 就 不 需要 在 每 个 请 求 进入 业务 逻辑 之 前 都 写 重 复 的 validate 函数 了 。 本 例 中 只 列 出 
个 validator 非常 简单 的 几 个 功能 。 


我 们 试 着 跑 一 下 这 个 程序 ， 输 入 参数 设置 为 : 


人 


var req = i i 


Username Xanga 
PasswordNew 20h nos 
PasswordRepeat : "ohn", 
Email : "alexQabc.com", 
} 
err := validate.Struct(mystruct) 


fmt.Println(err) // Key: 'RegisterReq.PasswordRepeat' Error:Field validation for 'Passwor 





得 这 个 validator 提供 的 错误 信息 不 够 人 性 化 ， 例 如 要 把 错误 信息 返回 给 用 户 ， 那 就 不 
应 该 直接 显示 英文 了 。 可 以 针对 每 种 tag 进行 错误 信息 订 制 ， 读 者 可 以 自行 探索 。 


从 结构 上 来 看 ， 每 一 个 struct 都 可 以 看 成 是 一 棵 树 。 假 如 我 们 有 如 下 定义 的 struct : 
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type Nested struct { 
Email string ^"validate:"email"' 
} 
type T struct { 
Age int '"validate:"eq-10"^ 
Nested Nested 


把 这 个 struct 画 成 一 棵 树 : 





从 字段 校 验 的 需求 来 讲 ， 无 论 我 们 采用 深度 优先 搜索 还 是 广度 优先 搜索 来 对 这 棵 struct 树 来 
进行 遍历 ， 都 是 可 以 的 。 


我 们 来 写 一 个 递归 的 深度 优先 搜索 方式 的 遍历 demo : 


package main 


import ( 
n fmt n" 
Lnenlecto 
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"regexp" 
"strconv" 
"strings" 


type Nested struct { 
Email string '"validate:"email"' 
} 
type T struct { 
Age int ‘validate:"eq=10". 
Nested Nested 


func validateEmail(input string) bool { 
if pass, _ := regexp.MatchString( 人 ^([\w\.\_]{2,10})@(\w{1,}).([a-z]{2,4})$ , input); 
return erue 


n 
return false 
} 
func validate(v interface{}) (bool, string) { 
validateResult := true 
errmsg := "success" 


vt := reflect.TypeOf(v) 

vv := reflect.ValueOf(v) 

for i := 0; i < vv.NumField(); i++ { 
fieldVal :- vv.Field(i) 
tagContent :- vt.Field(i).Tag.Get("validate") 
k := fieldVal.Kind() 


switch k { 
case reflect. Tmt: 
val :- fieldVal.Int() 


tagValStr :- strings.Split(tagContent, "-") 
tagVal, _ := strconv.ParseInt(tagValstr[1], 10, 64) 
if val !- tagVal { 

errmsg = "validate int failed, tag is: "+ tagVal) 


return false 
j 
case reflect.String: 
val :- fieldVal.String() 
tagValStr :- tagContent 
switch tagValstr { 
case "email": 


nestedResult :- validateEmail(val) 
if nestedResult -- faise ( 
errmsg = "validate mail failed, field val is: "+ val 
validateResult = false 
} 
} 
case reflect.Struct: 
// WRA NUES] struct > ZR Z TRJR Fo 263875 






// Wh —^ 3x gu 


valInter := fieldVal.Interface() 
nestedResult :- validate(valInter) 
if nestedResult == false { 
validateResult = false 
} 
} 
} 
return validateResult 


} 


func main() { 
var a = T(Age: 10, Nested: Nested[Email: "abc@abc.com"}} 


validateResult :- validate(a) 
fmt.Println(validateResult) 





这 里 我 们 简单 地 对 eq-x fe email 这 两 个 tag 进行 了 支持 ， 读 者 可 以 对 这 个 程序 进行 简单 的 修 
改 以 查看 具体 的 validate 效果 。 为 了 演示 精简 掉 了 错误 处 理 和 复杂 case 的 处 理 ， 例 如 
reflect.Int8/16/32/64，reflect.Ptr 等 类 型 的 处 理 ， 如 果 给 生产 环境 编写 validate 库 的 话 ， 请 务 
必 做 好 功能 的 完善 和 容错 。 


在 前 一 小 节 中 介绍 的 validator 组 件 在 功能 上 要 远 比 我 们 这 里 的 demo 复杂 的 多 。 但 原理 很 简 
单 ， 就 是 用 reflect 对 struct 进行 树 形 遍 历 。 有 心 的 读者 这 时 候 可 能 会 产生 一 个 问题 ， 我 们 对 
struct 进行 validate 时 大 量 使 用 了 reflect， 而 go 的 reflect 在 性 能 上 不 太 出 众 ， 有 时 甚至 会 影 
响 到 我 们 程序 的 性 能 。 这 样 的 考虑 确实 有 一 些 道理 ， 但 需要 对 struct 进行 大 量 校 验 的 场景 往 
往 出 现在 web 服务 ， 这 里 并 不 一 定 是 程序 的 性 能 瓶颈 所 在 ， 实 际 的 效果 还 是 要 从 pprof 中 做 
更 精确 的 判断 。 


如 果 基 于 反射 的 validator 览 的 成 为 了 你 服务 的 性 能 瓶颈 怎么 办 ?现在 也 有 一 种 思路 可 以 避免 
反射 : 使 用 golang 内 置 的 parser 对 源 代 码 进 行 扫描 ， 然 后 根据 struct 的 定义 生成 校 验 代 

码 。 我 们 可 以 将 所 有 需要 校 验 的 结构 体 放 在 单独 的 package 内 。 这 就 交 给 读者 自己 去 探索 
f 


5.5. Database 和 数据 库 打 交道 


本 节 将 对 db/sql 官方 标准 库 作 一 些 简单 分 析 ， 并 介绍 一 些 应 用 比较 广泛 的 开源 orm 和 sql 
builder。 并 从 企业 级 应 用 开发 和 公司 架构 的 角度 来 分 析 哪 种 技术 栈 对 于 现代 的 企业 级 应 用 更 
为 合适 。 


从 database/sql 讲 起 


golang 官方 提供 了 database/sql 包 来 给 用 户 进行 和 数据 库 打 交道 的 工作 ， 实 际 上 
database/sql 库 就 只 是 提供 了 一 套 操作 db 的 接口 和 规范 ， 例 如 抽象 好 的 sql 预 处 理 
(prepare)， 连 接 池 管理 ， 数 据 绑 定 ， 事 务 ， 错 误 处 理 等 等 。 官 方 并 没有 提供 具体 某 种 数据 库 
实现 的 协议 支持 。 


和 具体 的 数据 库 ， 例 如 MySQL 打交道 ， 还 需要 再 引入 MySQL. 的 驱动 ， 像 下 面 这 样 : 


import "database/sql" 


import "github.com/go-sql-driver/mysql" 


db, err := sql.Open("mysql1", "user:passwordQ/dbname") 


import "github.com/go-sql-driver/mysql" 


这 一 句 import， 实 际 上 是 调用 了 mysql 包 的 init 函数 ， 做 的 事情 也 很 简单 : 


func init() { 
sql.Register("mysql", &MySQLDriver[(?!) 
H 


在 sql 包 的 全 局 map 里 把 mysql 这 个 名 字 的 driver 注册 上 。 实 际 上 Driver 在 sql 包 中 是 一 
interface : 


type Driver interface { 
Open(name string) (Conn, error) 


} 


调用 sql.Open() 返回 的 db 对 象 实际 上 就 是 这 里 的 Conn » 


个 


type Conn interface { 
Prepare(query string) (Stmt, error) 
Close() error 
Begin() (Tx, error) 


也 是 一 个 接口 。 实 际 上 如 果 你 仔细 地 查看 database/sql/driver/driver.go 的 代码 会 发 现 ， 这 个 
文件 里 所 有 的 成 员 全 都 是 interface， 对 这 些 类 型 进行 操作 ， 实 际 上 还 是 会 调用 具体 的 driver 
里 的 方法 。 


从 用 户 的 角度 来 讲 ， 在 使 用 database/sql 包 的 过 程 中 ， 你 能 够 使 用 的 也 就 是 这 些 interface 里 
提供 的 函数 。 来 看 一 个 使 用 database/sql 和 go-sql-driver/mysql 的 完整 的 例子 : 


package main 


import ( 
"database/sq1" 
. "github.com/go-sql-driver/mysq1l" 


func main() { 
// db 是 一 个 sgl.DB Xx E 
// 该 对 象 线程 安全 ， 且 内 部 已 包含 了 一 个 连接 池 


/ 连接 池 的 选项 可 以 在 sql.Open 中 设置 ， 这 里 为 了 简单 省 略 了 





db, err := sql.Open("mysq1", 
"user:passwordQtcp(127.0.0.1:3306)/hello") 
if err !- nil ( 
log.Fatal(err) 


} 
defer db.Close() 
var ( 

id int 


name string 


) 
rows, err :- db.Query("select id, name from users where id - ?", 1) 
if err !- nil { 

log.Fatal(err) 


defer rows.Close() 


// 必须 要 把 rows 里 的 内 容 读 完 ， 否 则 连接 永远 不 会 释放 
for rows.Next() { 
err := rows.Scan(&id, &name) 
if err !- nil ( 
log.Fatal(err) 
} 


log.Println(id, name) 


err = rows.Err() 
if err !- nil ( 
log.Fatal(err) 


如 果 读 者 想 了 解 官方 这 个 database/sql 库 更 加 详细 的 用 法 的 话 ， 可 以 参考 : 
http://go-database-sql.org/ 


包括 该 库 的 功能 介绍 、 用 法 、 注 意 事 项 和 反 直 觉 的 一 些 实现 方式 (例如 同一 个 goroutine 内 对 
sql.DB 的 查询 ， 可 能 在 多 个 连接 上 ) 都 有 涉及 ， 本 章 中 不 再 孝 述 。 


聪明 如 你 的 话 ， 在 上 面 这 段 简短 的 程序 中 可 能 已 经 嗅 出 了 一 些 不 好 的 味道 。 官 方 的 db 库 提供 
的 功能 这 么 简单 ， 我 们 每 次 去 数据 库 里 读 取 内 容 岂 不 是 都 要 去 写 这 么 一 套 差不多 的 代码 ?或 
者 如 果 我 们 的 对 象 是 struct， 把 sql.Rows 绑 定 到 对 象 的 工作 就 会 变 得 更 加 得 重复 而 无 聊 。 


是 的 ， 所 以 社区 才 会 有 各 种 各 样 的 sql builder 和 orm 百花 齐 放 。 


提高 生产 效率 的 orm 和 sql builder 
在 web 开发 领域 常常 提 到 的 orm 是 什么 ?我 们 先 看 看 万 能 的 维基 百科 : 


对 象 关系 映射 (英语 : Object Relational Mapping， 简 称 ORM， 或 O/RM， 或 O/R mapping) ， 
是 一 种 程序 设计 技术 ， 用 于 实现 面向 对 象 编程 语言 里 不 同类 型 系统 的 数据 之 间 的 转换 。 
从 效果 上 说 ， 它 其 实 是 创建 了 一 个 可 在 编程 语言 里 使 用 的 “虚拟 对 和 象 数 据 库 ”。 


最 为 常见 的 orm 实际 上 做 的 是 从 db -> 程序 的 class / struct 这 样 的 映射 。 所 以 你 手边 的 程序 
可 能 是 从 mysql 的 表 -> 你 的 程序 内 class。 我 们 可 以 先 来 看 看 其 它 的 程序 语言 里 的 orm 写 起 
来 是 怎么 样 的 感觉 : 


>>> from blog.models import Blog 
>>> b = Blog(name-'Beatles Blog', tagline-'All the latest Beatles news.') 
>>> b.save() 


完全 没有 数据 库 的 痕迹 ， 没 错 。orm 的 目的 就 是 屏蔽 掉 db 层 ， 实 际 上 很 多 语言 的 orm 只 要 
把 你 的 class/struct 定义 好 ， 再 用 特定 的 语法 将 结构 体 之 间 的 一 对 一 或 者 一 对 多 关系 表达 出 
来 。 那 么 任务 就 完成 了 。 然 后 你 就 可 以 对 这 些 映 射 好 了 数据 库 表 的 对 象 进行 各 种 操作 ， 例 如 
save，create，retrieve，delete。 至 于 orm 背 着 你 背地 里 做 了 什么 阴险 的 名 当 ， 你 是 不 一 定 
清楚 的 。 使 用 orm 的 时 候 ， 我 们 往往 比较 容易 有 一 种 忘记 了 数据 库 的 直观 感受 。 举 个 例子 ， 
我 们 有 个 一 需求 ， 是 向 用 户 展示 最 新 的 商品 列表 ， 我 们 再 假设 ， 我 们 的 商品 和 商家 是 一 对 一 
的 关联 关系 ， 我 们 就 很 容易 写 出 像 下 面 这 样 的 代码 : 


shopList := [] 
for product in productList { 

shopList = append(shopList, product.GetShop) 
} 


当然 了 ， 我 们 不 能 批判 这 样 写 代码 的 程序 员 是 偷懒 的 程序 员 。 因 为 orm 一 类 的 工具 在 出 发 点 
上 就 是 屏蔽 sql， 让 我 们 对 数据 库 的 操作 更 接近 于 人 类 的 思维 方式 。 这 样 很 多 只 接触 过 orm 而 
且 又 是 刚 入 行 的 程序 员 就 很 容易 写 出 上 面 这 样 的 代码 。 


这 样 的 代码 将 对 数据 库 的 读 请 求 放大 了 N 倍 。 也 就 是 说 ， 如 果 你 的 商品 列表 有 15 A sku > 2 
么 每 次 用 户 打 开 这 个 页 面 ， 至 少 需要 执行 1( 查 询 商 品 列表 ) + 15( 查 询 相关 的 商铺 信息 ) 次 查 
询 。 这 里 N 是 16。 如 果 你 的 列表 页 很 大 ， 比 如 说 有 600 个 条 目 ， 那 么 你 就 至 少 要 执行 + 
600 次 查询 。 如 果 说 你 的 数据 库 能 够 承受 的 最 大 的 简单 查询 是 12w qps， 而 上 述 这 样 的 查询 正 
好 是 你 最 常用 的 查询 的 话 ， 实 际 上 你 能 对 外 提供 的 服务 能 力 是 多 少 呢 ? 是 200 qps ! 互联 网 系 
统 的 辟 讳 之 一 ， 就 是 这 种 无 端的 读 放大 。 

当然 ， 你 也 可 以 说 这 不 是 orm 的 问题 ， 如 果 你 手写 sd 你 还 是 可 能 会 写 出 差不多 的 程序 ， 那 
么 再 来 看 两 个 demo : 


o := orm.NewOrm( ) 
num, err := o.QueryTable("cardgroup").Filter("Cards Card Name", cardName).All(&cardgrou 


a Án 


很 多 orm 都 提供 了 这 种 Filter 类 型 的 查询 方式 ，beego 也 不 例外 。 不 过 实际 上 在 这 段 orm 背 
后 隐藏 了 非常 难以 察觉 的 细节 ， 那 就 是 生成 的 sql 语句 会 自动 limit 1000 » 





也 许 喜欢 beego HÈR RLAR T > REAA Hk beego 的 文档 就 瞎 写 。 是 的 ， 
尽管 beego 在 文档 里 说 明了 Al 查询 在 不 显 式 地 指定 Limit 的 话 会 自动 limit 1000， 但 对 于 很 
多 没有 阅读 过 文档 或 者 看 过 beego 源码 的 人 ， 这 依然 是 一 个 非常 难以 察觉 的 “魔鬼 "细节 。 喜 
欢 强 类 型 语言 的 人 一 般 都 不 喜欢 语言 隐 式 地 去 做 什么 事情 ， 例 如 各 种 语言 在 赋值 操作 时 进行 
的 隐 式 类 型 转换 然后 又 在 转换 中 丢失 了 精度 的 名 当 ， 一 定 让 你 非常 的 头 阁 。 所 以 一 个 程序 库 
背地 里 做 的 事情 还 是 越 少 越 好 ， 如 果 一 定 要 做 ， 那 也 一 定 要 在 显眼 的 地 方 做 。 比 如 上 面 的 例 
子 ， 去 掉 这 种 默认 的 自作 聪明 的 行为 ， 或 者 要 求 用 户 强制 传 入 limit 参数 都 是 更 好 的 选择 。 


除了 limit 的 问题 ， 我 们 再 看 一 遍 这 个 beego orm 的 查询 : 


num, err := o.QueryTable("cardgroup").Filter("Cards Card Name", cardName).All(&cardgrou 
| i Ug eere uueee«ioeoococuLosdOhouo uu 1 1... 08 E 


你 可 以 看 得 出 来 这 个 Filter 是 有 表 join 的 操作 么 ? 当然 了 ， 对 beego orm 有 过 深入 使 用 经 验 
的 用 户 还 是 会 觉得 这 是 在 吹 毛 求 疯 。 但 这 样 的 分 析 想 证 明 的 是 ，orm 想 从 设计 上 隐 去 太 多 的 
细节 。 而 方便 的 代价 是 其 背后 的 运行 完全 失控 。 这 样 的 项 目 在 经 过 几 任 维护 人 员 之 后 ， 将 变 
得 面目 全 非 ， 难 以 维护 。 





当然 ， 我 们 不 能 否认 orm 的 进步 意义 ，orm 的 设计 初衷 是 为 了 让 数据 的 操作 和 存储 的 具体 实 
现 所 剥离 。 但 是 上 了 规模 的 公司 的 人 们 渐渐 达成 了 一 个 共识 ， 由 于 隐藏 重要 的 细节 ，orm 可 
能 是 失败 的 设计 。 其 所 隐藏 的 重要 细节 对 于 上 了 规模 的 系统 开发 来 说 至 关 重 要 。 

相 比 orm 来 说 ，sql builer 在 sql 和 项 目 可 维护 性 之 间 取 得 了 比较 好 的 平衡 。 首 先 sql builer 不 
像 orm 那样 屏蔽 了 过 多 的 细节 ， 其 次 从 开发 的 角度 来 讲 ，sql builder 简单 进行 封装 后 也 可 以 
非常 高 效 地 完成 开发 ， 举 个 例子 : 


where := map[string]interface(j 1 


torden md > 2 0 
"customer id != ?" : 0, 
} 
limit := []int{0, 100} 
orderBy := []string["id asc", "create time desc") 
orders := orderModel.GetList(where, limit, orderBy) 


写 sql builder 的 相 LM ， 或 者 读 懂 都 不 费劲 。 把 这 些 代码 脑 内 转换 为 sql 也 不 会 太 费 劲 。 
所 以 通过 代码 就 可 以 对 这 个 查询 是 否 命中 数据 库 索 引 ， 是 否 走 了 履 盖 索引 ， 是 否 能 够 用 上 联 
合 索 引进 行 分 析 了 。 


说 白 了 sql builder 是 sql 在 代码 里 的 一 种 特殊 方言 ， 如 果 你 们 没有 dba 并 且 研 发 有 自己 分 析 
和 优化 sql 的 能 力 ， 或 者 你 们 公司 的 dba 对 于 学 习 这 样 一 些 sql 的 方言 没有 异议 。 那 么 使 用 
sql builder 是 一 个 比较 好 的 选择 ， 不 会 导致 什么 问题 。 


另外 在 一 些 本 来 也 不 需要 dba 介入 的 场景 内 ， 使 用 sql builder 也 是 可 以 的 ， 例 如 你 要 做 一 套 
运 维 系统 ， 且 将 mysql 当 作 了 系统 中 的 一 个 组 件 ， 系 统 的 qps 不 高 ， 查 询 不 复杂 等 等 。 


一 旦 你 做 的 是 高 并 发 的 OLTP 在 线 系统 ， 且 想 在 人 员 充 足 分 工 明确 的 前 提 下 最 大 程度 控制 系 
统 的 风险 ， 使 用 sql builder 就 不 合适 了 。 


脆弱 的 db 


无 论 是 orm 还 是 sql builder 都 有 一 个 致命 的 缺点 ， 就 是 没有 办 法 进行 系统 上 线 的 事前 sql v 

ia 。 虽 然 很 多 orm 和 sql builder 也 提供 了 运行 期 打印 sql 的 功能 ， 但 Mp 查询 的 时 候 才 能 进 
输出 。 而 sql builder 和 orm 本 身 提供 的 功能 太 过 灵活 。 使 得 你 不 可 能 通过 测试 枚 举 出 所 有 
可 能 在 线 上 执行 的 sql。 例 如 你 可 能 用 sql builder 写 出 下 面 这 样 的 代码 : 


where := map[string]interface{} { 
"product id - ?" : 160, 
UL uüsensidezs20:912929 


j 
if order id !- 0 ( 
where["order id = ?"] = order id 


res, err :- historyModel.GetList(where, limit, orderBy) 


你 的 系统 里 有 类 似 上 述 样 例 的 大 量 放 的 话 ， 就 难以 通过 test case 来 覆盖 到 所 有 可 能 的 sql 组 
合 了 。 


这 样 的 系统 只 要 发 布 ， 就 已 经 孕育 了 初期 的 巨大 风险 。 


对 于 现在 7* 24 服务 的 互联 网 公司 来 说 ， 服务 不 可 用 是 非常 重大 的 问题 。 存 储 层 的 技术 栈 虽 
经 历 了 多 年 的 发 展 ， 在 整个 系统 中 依然 是 最 为 脆弱 的 一 环 。 系 统 宕 机 对 于 24 小 时 对 外 提供 服 
务 的 公司 来 说 ， 意 味 着 直接 的 经 济 损失 。 个 中 风险 不 可 和 忽视。 


从 行业 分 工 的 角度 来 讲 ， WA dba。 大 多 数 dba 并 不 一 定 有 写 代 码 

的 能 力 ， 去 阅读 sql builder 的 相关 “ 拼 sq 代码 多 多 少 少 还 是 会 有 一 点 障碍 。 从 dba 角度 出 

i ， 还 是 希望 能 够 有 专门 的 事前 sql 审核 机 制 ， 并 能 让 其 低 成 本 地 获取 到 系统 的 所 有 sql 内 
， 而 不 是 去 阅读 业务 研发 编写 的 sql builder 的 相关 代码 。 


所 以 现 如 今 ， 大 型 的 互联 网 公司 核心 线 上 业务 都 会 在 代码 中 把 sq| 放 在 显眼 的 位 置 提供 给 dba 
review， 以 此 来 控制 系统 在 数据 层 的 风险 。 结 合 golang 举 一 个 例子 : 


const ( 
getAllByProductIDAndCustomerID = 'select * from p orders where product id in (:produc 


// GetAllByProductIDAndCustomerID 

// (param driver id 

// Qparam rate date 

// Qreturn []Order, error 

func GetAllByProductIDsAndCustomerID(ctx context.Context, productIDs [j]uint64, customerID 
var orderList []Order 


params := map[string]interface(jt 
"product id" : productIDs, 
"customer id": customerID, 


// getAllByProductIdsAndCustomerID 是 const 类 型 的 sql 4€ 
sql, args, err := sqglutil.Named(getAllByProductIDsAndCustomerID, params) 
if err !- nil { 

return nil, err 


err = dao.QueryList(ctx, sqldbInstance, sql, args, &orderList) 
if err !- nil ( 
return nil, err 


return orderList, err 





像 这 样 的 代码 ， 在 上 线 之 前 把 dao Æ 集 的 const 部 分 直接 拿 给 dba 来 进行 审核 ， 就 比 
较 方便 了 。 代 码 中 的 sqlutil. Named sqlx 中 的 Named 有 函数 ， 同 时 支持 where 表达 
式 中 的 比较 操作 符 和 ine 


这 里 为 了 说 明 简便 , X5 dg aS , iFa S.A: —T 8) 15 4e d 82 S EGET E 
步 进行 简化 。 请 读者 朋友 们 自行 尝试 。 


5.6. Ratelimit 服务 流量 限制 


计算 机 程序 可 依据 其 瓶颈 分 为 Disk IO-bound，CPU-bound，Network-bound， 分 布 式 场景 下 
有 时 候 也 会 外 部 系统 而 导致 自身 浇 颈 。 


web 系统 打交道 最 多 的 是 网 络 ， 无 论 是 接受 ， 解 析 用 户 请 求 ， 访 问 存储 ， 还 是 把 响应 数据 返 
回 给 用 户 ， 都 是 要 走 网 络 的 。 在 没有 epollkqueue 之 类 的 系统 提供 的 IO 多 路 复 用 接口 之 前 ， 
多 个 核心 的 现代 计算 机 最 头痛 的 是 C10k 问题 ，C10k 问题 会 导致 计算 机 没有 办 法 充分 利用 

CPU 来 处 理 更 多 的 用 户 连接 ， 进 而 没有 办 法 通过 优化 程序 提升 CPU 利用 浴 来 处 理 更 多 的 请 


从 linux 实现 了 epoll > freebsd 实现 了 kqueue， 这 个 问题 基本 解决 了 ， 我 们 可 以 借助 内 核 提 
供 的 API 轻松 解决 当年 的 C10k 问题 ， 也 就 是 说 如 今 如 果 你 的 程序 主要 是 和 网 络 打交道 ， 那 
么 瓶颈 一 定 在 用 户 程序 而 不 在 操作 系统 内 核 。 


随 着 时 代 的 发 展 ， 编 程 语言 对 这 些 系统 调用 又 进一步 进行 了 封装 ， 如 今 做 应 用 层 开 发 ， 几 乎 
不 会 在 程序 中 看 到 epoll 之 类 的 字眼 ， 大 多 数 时 候 我 们 就 只 要 聚焦 在 业务 逻辑 上 就 好 。Golang 
的 网 络 库 针 对 不 同 平台 封装 了 不 同 的 syscall API > http 库 又 是 构建 在 net 库 之 上 ， 所 以 在 Go 
我 们 可 以 借助 标准 库 ， 很 轻松 地 写 出 高 性 能 的 http 服务 ， 下 面 是 一 个 简单 的 _ hello world 服 
务 的 代码 : 


package main 


import ( 
"io? 
LIO 
"net/http" 
) 


func sayhello(wr http.ResponseWwriter, r *http.Request) { 
wr.WriteHeader(200) 
io.writeString(wr, "hello world") 


} 


func main() { 
http.HandleFunc("/", sayhello) 
err := http.ListenAndServe(":9090", nil) 
if err != nil { 
log.Fatal("ListenAndServe:", err) 


} 


我 们 需要 衡量 一 下 这 个 web 服务 的 吞吐 量 ， 再 具体 一 些 ， 实 际 上 就 是 接口 的 QPS。 借 助 
Wrk， 在 家 用 电脑 Macbook Pro 上 对 这 个 nello world 服务 进行 基准 测试 ，Mac 的 硬件 情况 
如 下 : 


CPU: Intel(R) Core(TM) i5-5257U CPU @ 2.70GHz 


Core: 2 
Threads: 4 
Graphics/Displays: 


Chipset Model: Intel Iris Graphics 6100 

Resolution: 2560 x 1600 Retina 
Memory Slots: 
Size: 4 GB 
Speed: 1867 MHz 
Size: 4 GB 
Speed: 1867 MHz 
Storage: 

Size: 250.14 GB (250,140,319,744 bytes) 
Media Name: APPLE SSD SM0256G Media 
Size: 250.14 GB (250,140,319,744 bytes) 
Medium Type: SSD 


测试 结果 : 


~ ))) wrk -c 10 -d 10s -t10 http://localhost:9090 
Running 10s test @ http://localhost :9090 
10 threads and 10 connections 


Thread Stats Avg Stdev Max +/- Stdev 
Latency 339. 99us 1.28ms 44.43ms 98.2996 
Reg/Sec 4.49k . 656.81 7.47k 73.36% 


449588 requests in 10.10s, 54.88MB read 
Requests/sec: 44513.22 
Transfer/sec: 5.43MB 


~ ))) wrk -c 10 -d 10s -t10 http://localhost :9090 
Running 10s test @ http://localhost :9090 
10 threads and 10 connections 


Thread Stats Avg Stdev Max +/- Stdev 
Latency 334.76us 1.21ms 45.47ms 98.27% 
Reg/Sec 4.42k 633.62 6.90k 71.1696 


443582 requests in 10.10s, 54.15MB read 
Requests/sec:  43911.68 
Transfer/sec: 5.36MB 


~ ))) wrk -c 10 -d 10s -t10 http://localhost:9090 
Running 10s test @ http://localhost :9090 
10 threads and 10 connections 


Thread Stats Avg Stdev Max +/- Stdev 
Latency 379.26us 1.34ms 44.28ms 97.6296 
Req/Sec 4.55k 591.64 8.20k 76.3796 


455710 requests in 10.10s, 55.63MB read 
Requests/sec: 45118.57 
Transfer/sec: 5.51MB 


多 次 测试 的 结果 在 4w 左右 的 QPS 浮 动 ， 响 应 时 间 最 多 也 就 是 40ms 左右 ， 对 于 一 个 web 程 
序 来 说 ， 这 已 经 是 很 不 错 的 成 绩 了 ， 我 们 只 是 照抄 了 别人 的 示例 代码 ， 就 完成 了 一 个 高 性 能 
的 hello world 服务 器 ? 是 不 是 很 有 成 就 感 ? 


这 还 只 是 家 用 PC， 线 上 服务 器 大 多 都 是 24 核心 起 ，32G 内 存 +，CPU 基本 都 是 Inteli7。 所 
以 同样 的 程序 在 服务 器 上 运行 会 得 到 更 好 的 结果 。 


这 里 的 hello world 服务 没有 任何 业 LE S A SEXRNLUERAEENE > 有 些 程序 偏 
Network-bound， 例 如 一 些 cdn 服务 、proxy 服务 ; 有 些 程序 偏 CPU/GPU bound， 例 如 登陆 
校 验 服务 、 图 像 处 理 服务 ; 有 些 程序 偏 Disk 10-bound， 例 如 专门 的 存储 系统 ， 数 据 库 。 不 同 
的 程序 瓶颈 会 体现 在 不 同 的 地 方 ， 这 里 提 到 的 这 些 功能 单一 的 服务 相对 来 说 还 算 容易 分 析 。 
如 果 碰 到 业务 逻辑 复杂 代码 量 巨 大 的 模块 ， 其 瓶颈 并 不 是 三 下 五 除 二 可 以 推测 出 来 的 ， 还 是 
需要 从 压力 测试 中 得 到 更 为 精确 的 结论 。 


对 于 IO/Network bound 类 的 程序 ， 其 表现 是 网 卡 / 磁 盘 IO AAT CPU 打 满 ， 这 种 情况 即使 
优化 CPU 的 使 用 也 不 能 提高 整个 系统 的 吞吐 量 ， 只 能 提高 磁盘 的 读 写 速 度 ， 增 加 内 存 大 小 ， 
提升 网 卡 的 带宽 来 提升 整体 性 能 。 而 CPU bound 类 的 程序 ， 则 是 在 存储 和 网 卡 未 打 满 之 前 

CPU 占用 率 提 前 到 达 10096 * CPU 忙于 各 种 计算 任务 ，1O 设备 相对 则 较 闲 。 


无 论 哪 种 类 型 的 服务 ， 在 资源 使 用 到 极限 的 时 候 都 会 导致 请 求 堆积 ， 超 时 ， 系 统 hang 死 ， 
终 伤害 到 终端 用 户 。 对 于 分 布 式 的 web 服务 来 说 ， 瓶 颈 还 不 一 定 总 在 系统 内 部 ， 也 有 可 能 在 
外 部 。 非 计算 密集 型 的 系统 往往 会 在 关系 型 数据 库 环节 失守 ， 而 这 时 候 web 模块 本 身 还 远 远 
未 达到 瓶颈 。 


不 管 我 们 的 服务 瓶颈 在 哪里 ， 最 终 要 做 的 事情 都 是 一 样 的 ， 那 就 是 流量 限制 。 


常见 的 流量 限制 手段 
流量 限制 的 手段 有 很 多 ， 最 常见 的 R> AAAH : 


1. RUD NAE 满 了 水 的 桶 ， 每 过 固定 的 一 段 时 间 即 向 外 漏 一 滴水 。 如 果 你 
接 到 了 这 滴水 ， 那 么 你 就 可 以 继续 服务 请 求 ， 如 果 没 有 接 到 ， 那 么 就 需要 等 待 下 一 
水 。 

2. 令 牌 桶 则 是 指 匀 速 向 桶 中 添加 令 牌 ， 服 务 请 求 时 需要 从 桶 中 获取 令 牌 ， 令 牌 的 数目 可 以 
按照 需要 消耗 的 资源 进行 对 应 的 调整 。 如 果 没 有 令 牌 ， 可 以 选择 等 待 ， 或 者 放弃 。 


这 两 种 方法 看 起 来 很 像 ， 不 过 还 是 有 区 别 的 。 汤 桶 流出 的 速率 固定 ， 而 令 牌 桶 只 要 在 桶 中 有 

令 牌 ， 那 就 可 以 拿 。 E C UE 的 并 发 的 ， 比 如 同一 个 时 刻 ， 有 100 个 
用 户 请 求 ， 只 要 令 牌 桶 中 有 100 个 令 牌 ， 那 么 这 100 个 请 求全 部 会 放 过 去 。 令 牌 桶 在 桶 中 没 
有 令 牌 的 情况 下 也 会 退化 为 漏 桶 模型 。 
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实际 应 用 中 令 牌 桶 应 用 较为 广泛 ， 开 源 界 流行 的 限 流 器 大 多 数 都 是 基于 令 牌 桶 思想 的 。 并 且 
在 此 基础 上 进行 了 一 定 程 度 的 扩充 ， 比 如 github.com/juju/ratelimit 提供 了 几 种 不 同 特色 的 
令 有 牌 桶 填充 方式 : 


func NewBucket(fillInterval time.Duration, capacity int64) *Bucket 


默认 的 令 牌 桶 ， 人 illnterval 指 每 过 多 长 时 间 向 桶 里 放 一 个 令 牌 ，capacity 是 桶 的 容量 ， 超 过 桶 
容量 的 部 分 会 被 直接 丢弃 。 桶 初始 是 满 的 。 


func NewBucketWithQuantum(fillInterval time.Duration, capacity, quantum int64) *Bucket 


和 普通 的 NewBucket 的 区 别 是 ， 每 次 向 桶 中 放 令 牌 时 ， 是 放 quantum 个 令 牌 ， 而 不 是 一 个 
AR e 


func NewBucketWithRate(rate float64, capacity int64) *Bucket 


这 个 就 有 点 特殊 了 ， 会 按照 提供 的 比例 ， 每 秒 钟 填充 令 牌 数 。 例 如 capacity X 100 > 而 rate 
是 0.1， 那 么 每 秒 会 填充 10 个 令 牌 。 


从 桶 中 获取 令 牌 也 提供 了 几 个 API : 


func (tb *Bucket) Take(count int64) time.Duration {} 

func (tb *Bucket) TakeAvailable(count int64) int64 {} 

func (tb *Bucket) TakeMaxDuration(count int64, maxwait time.Duration) (time.Duration, boo 
func (tb *Bucket) Wait(count int64) {} 

func (tb *Bucket) WaitMaxDuration(count int64, maxWwait time.Duration) bool {} 


El — i 








名 称 和 功能 都 比较 直观 ， 这 里 就 不 再 元 述 了 。 相 比 于 开源 界 更 为 有 名 的 google 的 Java 工具 
Æ Guava 中 提供 的 ratelimiter， 这 个 库 不 支持 令 牌 桶 预 热 ， 且 无 法 修改 初始 的 令 牌 容量 ， 所 
以 可 能 个 别 极 端 情 况 下 的 需求 无 法 满足 。 但 在 明白 令 牌 桶 的 基本 原理 之 后 ， 如 果 没 办 法 满足 
需求 ， 相 信 你 也 可 以 很 快 对 其 进行 修改 并 支持 自己 的 业务 场景 。 


原理 


从 功能 上 来 看 ， 令 牌 桶 模型 实际 上 就 是 对 全 局 计数 的 加 减法 操作 过 程 ， 但 使 用 计数 需要 我 们 
自己 加 读 写 锁 ， 有 小 小 的 思想 负担 。 如 果 我 们 对 Go 语言 已 经 比较 熟悉 的 话 ， 很 容易 想到 可 以 
用 buffered channel 来 完成 简单 的 加 令 牌 取 令 牌 操作 : 


var tokenBucket = make(chan struct{}, capacity) 


每 过 一 段 时 间 向 tokenBucket 中 添加 token， 如 果 bucket 已 经 满 了 7， 那 么 直接 放弃 : 


fillToken := func() { 
ticker := time.NewTicker(fillInterval) 
for ( 
select { 
case «-ticker.C: 
select ( 
case tokenBucket <- struct{}{}: 
default: 
j 


fmt.Println("current token cnt:", len(tokenBucket), time.Now()) 


把 代码 组 合 起 来 : 


package main 


import ( 
Imt 
"time" 


func main() { 
var fillInterval = time.Millisecond * 10 
var capacity = 100 
var tokenBucket = make(chan struct{}, capacity) 


fillToken := func() { 


ticker :- time.NewTicker(fillInterval) 
for A 
select f 
case «-ticker.C: 
select ( 
case tokenBucket <- struct{}{}: 
default: 
} 


fmt.Println("current token cnt:", len(tokenBucket), time.Now()) 


go fillToken() 
time.Sleep(time.Hour) 


看 看 运行 


= 


current token cnt: 98 2018-06-16 18:17:50.234556981 +0800 CST m=+0.981524018 
current token cnt: 99 2018-06-16 18:17:50.243575354 +0800 CST m=+0.990542391 
current token cnt: 100 2018-06-16 18:17:50.254628067 +0800 CST m=+1.001595104 
current token cnt: 100 2018-06-16 18:17:50.264537143 +0800 CST m=+1.011504180 
current token cnt: 100 2018-06-16 18:17:50.273613018 +0800 CST m=+1.020580055 
current token cnt: 100 2018-06-16 18:17:50.2844406 +0800 CST m=+1.031407637 
current token cnt: 100 2018-06-16 18:17:50.294528695 +0800 CST m=+1.041495732 
current token cnt: 100 2018-06-16 18:17:50.304550145 +0800 CST m=+1.051517182 
current token cnt: 100 2018-06-16 18:17:50.313970334 +0800 CST m=+1.060937371 


在 1s 4t E I IER] 93385 100 个 ， 没 有 太 大 的 偏差 。 不 过 这 里 可 以 看 到 ，Go 的 定时 器 存在 大 
约 0.001s 的 误差 ， 所 以 如 果 令 牌 桶 大 小 在 1000 以 上 的 填充 可 能 会 有 一 定 的 误差 。 对 于 一 般 
的 服务 来 说 ， 这 一 点 误差 无 关 紧 要 。 


上 面 的 令 牌 桶 的 取 令 牌 操作 实现 起 来 也 比较 简单 ， 简 化 问题 ， 我 们 这 里 只 取 一 个 令 牌 : 


func TakeAvailable(block bool) bool{ 
var takenResult bool 
if block { 
select { 
case «-tokenBucket: 
takenResult - true 


} 
} else { 
select ( 
case «-tokenBucket: 
takenResult - true 
default: 
takenResult - faise 


} 


return takenResult 


一 些 公司 自己 造 的 限 流 的 轮子 就 是 用 上 面 这 种 方式 来 实现 的 ， 不 过 如 果 开 源 版 ratelimit 也 如 
此 的 话 ， 那 我 们 也 没什么 可 说 的 了 。 现 实 并 不 是 这 样 的 。 


我 们 来 思考 一 下 ， 令 牌 桶 每 隔 一 段 固定 的 时 间 向 桶 中 放 令 牌 ， 如 果 我 们 记 下 上 一 次 放 令 牌 的 
时 间 为 t1， 和 当时 的 令 牌 数 kK1， 放 令 牌 的 时 间 问 隔 为 {i， 每 次 向 令 牌 桶 中 放 X 个 令 牌 ， 令 牌 
桶 容量 为 cap。 现 在 如 果 有 人 来 调用 Takeavailable 来 取 n 个 令 牌 ， 我 们 将 这 个 时 刻 记 为 
t2。 在 t2 时 刘 ， 令 牌 桶 中 理论 上 应 该 有 多 少 令 牌 呢 ? 伪 代码 如 下 : 


cur ki + ((t2 = t1)/ti) * x 


cur = cur > cap ? cap : cur 


我 们 用 两 个 时 间 点 的 时 间 差 ， 再 结合 其 它 的 参数 ， 理 论 上 在 取 令 牌 之 前 就 完全 可 以 知道 桶 里 
有 多 少 令 牌 了 。 那 劳 心 费力 地 像 本 小 节 前 面向 channel €J& À token 的 操作 ， 理 论 上 是 没有 
必要 的 。 只 要 在 每 次 Take 的 时 候 ， 再 对 令 牌 桶 中 的 token 数 进行 简单 计算 ， 就 可 以 得 到 正 
确 的 令 牌 数 。 是 不 是 很 像 惰性 求 值 的 感觉 ? 

在 得 到 正确 的 令 牌 数 之 后 ， 再 进行 实际 的 Take 操作 就 好 ， 这 个 Take 操作 只 需要 对 令 牌 数 进 
行 简单 的 减法 即 可 ， 记 得 加 锁 以 保证 并 发 安全 。 github.com/juju/ratelimit 这 个 库 就 是 这 样 
做 的 。 


服务 瓶颈 和 QoS 


前 面 我 们 说 了 很 多 CPU-bound、1O-bound 之 类 的 概念 ， 这 种 性 能 瓶颈 从 大 多 数 公司 都 有 的 
监控 系统 中 可 以 比较 快速 地 定位 出 来 ， 如 果 一 个 系统 遇 到 了 性 能 问题 ， 那 监控 图 的 反应 一 般 
都 是 最 快 的 。 


虽然 性 能 指标 很 重要 ， 但 对 用 户 提供 服务 时 还 应 考虑 服务 整体 的 QoS » QoS 全 称 是 Quality 
of Service ， 顾 名 思 义 是 服务 质量 。QoS 包含 有 可 用 性 、 知 吐 量 、 时 延 、 时 延 变 化 和 丢失 等 指 
标 。 一 般 来 讲 我 们 可 以 通过 优化 系统 ， 来 提高 web 服务 的 CPU 利用 率 ， 从 而 提高 整个 系统 
的 吞吐 量 。 但 吞吐 量 提高 的 同时 ， 用 户 体验 是 有 可 能 变 差 的 。 用 户 角 度 比较 敏感 的 除了 可 用 
性 之 外 ， 还 有 时 延 。 虽 然 你 的 系统 吞吐 量 高 ， 但 半天 刷 不 开 页 面 ， 想 必 会 造成 大 量 的 用 户 流 
失 。 所 以 在 大 公司 的 web 服务 性 能 指标 中 ， 除 了 平均 响应 时 延 之 外 ， 还 会 把 响应 时 间 的 95 
分 位 ，99 分 位 也 拿 出 来 作为 性 能 标准 。 平 均 响 应 在 提高 CPU 利用 率 没 受到 太 大 影响 时 ， 可 
能 95 分 位 、99 分 位 的 响应 时 间 大 幅度 攀升 了 ， 那 么 这 时 候 就 要 考虑 提高 这 些 CPU 利用 率 
所 付出 的 代价 是 否 值得 了 。 


在 线 系统 的 机 器 一 般 都 会 保持 CPU 有 一 定 的 余 裕 。 


5.7. layout 第 见 大 型 web 项 目 分 层 


流行 的 web 框架 大 多 数 是 MVC 框架 ，MVC 这 个 概念 最 早 由 Trygve Reenskaug 在 1978 年 
提出 ， 为 了 能 够 对 GUI 类 型 的 应 用 进行 方便 扩展 ， 将 程序 划分 为 : 


控制 器 (Controller) - 负责 转发 请 求 ， 对 请 求 进 行 处 理 。 

2. (View) -界面 设计 人 员 进 行 图 形 界面 设计 。 

3. 模型 (Model) - 程序 员 编写 程序 应 有 的 功能 (实现 算法 等 等 ) 、 数 据 库 专 家 进行 数据 管 
理 和 数据 库 设计 (可 以 实现 具体 的 功能 )。 


— 


随 着 BU ， 前 端 也 变 成 了 越 来 越 复杂 的 工程 ， 为 了 更 好 地 工程 化 ， 现 在 更 为 流行 的 一 
般 是 前 后 分 离 的 架构 。 可 以 认为 前 后 分 离 是 把 V EJ. MVC 中 抽 离 单独 成 为 项 目 。 这 样 一 个 

端 项 目 s M 和 C 层 了 。 前 后 端 之 间 通 过 ajax 来 交互 ， 有 时 候 要 解决 跨 域 的 问 
题 ， 但 也 已 经 有 了 较为 成 熟 的 方案 。 下 面 是 一 个 前 后 分 离 的 系统 的 简易 交互 图 。 
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图 里 的 vue 和 react 是 现在 前 端 界 比较 流行 的 两 个 框架 ， 因 为 我 们 的 重点 不 在 这 里 ， 所 以 前 
端 项 目 内 的 组 织 我 们 就 不 强调 了 。 事 实 上 ， 即 使 是 简单 的 项 目 ， 业 界 也 并 没有 完全 遵守 MVC 
功能 提出 者 对 于 M 和 C 所 定义 的 分 工 。 有 很 多 公司 的 项 目 会 在 controller £ XA X € WZ 

辑 ， 在 model 层 就 只 管理 数据 的 存储 。 这 往往 来 源 于 对 于 model 层 字 面 含义 的 某 种 擅自 引申 
理解 。 认 为 字面 意思 ， 这 一 层 就 是 处 理 某 种 建 模 ， 而 模型 是 什么 ?就 是 数据 器 ! 

这 种 理解 显然 是 有 问题 的 ， 业 务 流程 也 算是 一 种 “模型 "*， 是 对 监 实 世 界 用 户 行为 或 者 既 有 流程 
的 一 种 建 模 ， 并 非 只 有 按 格式 组 织 的 数据 才能 叫 模型 。 不 过 按照 MVO 的 创始 人 的 想法 ， 我 们 
如 果 把 和 数据 打交道 的 代码 还 有 业务 流程 全 部 塞 进 MVC 里 的 M 层 的 话 ， 这 个 M 层 又 会 显得 
有 些 过 于 腾 有 种。 对 于 复杂 的 项 目 ， 一 个 C 和 一 个 M 层 显 然 是 不 够 用 的 ， 现 在 比较 流行 的 纯 后 
端 api 模块 一 般 采 用 下 述 划分 方法 : 


1，Controller， 与 上 述 类 似 ， 服 务 入 口 ， 负 责 处 理 路 由 ， 参 数 校 验 ， 请 求 转发 


2. Logic/Service， 逻 辑 (服务 ) 层 ， 一 般 是 业务 逻辑 的 入 口 ， T 里 开始 ， 所 有 的 请 
求 参数 一 定 是 合法 的 。 业 务 逻 辑 和 业务 流程 也 都 在 这 一 层 中 。 常 见 的 设计 中 会 将 该 层 称 
为 Business Rules ° 

3. DAO/Repository ， 这 一 层 主要 负责 和 数据 、 存 储 打 交道 。 将 下 层 存 储 以 更 简单 的 函数 、 
接口 形式 暴露 给 Logic 层 来 使 用 。 负 责 数据 的 持久 化 工作 。 


每 一 层 都 会 做 好 自己 的 工作 ， 然 后 用 请 求 当 前 的 上 下 文 构造 下 一 层 工 作 所 需要 的 结构 体 或 其 
它 类 型 参数 ， 然 后 调用 下 一 次 的 函数 。 在 工作 完成 之 后 ， 再 把 处 理 结果 一 层 层 地 传 出 到 入 
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validate input 


build struct needed by logic, call function in logi 


logic check, use design patterns to work 


call save order func 







save order 


save order result 






return save result 





return result 





划分 为 CLD 三 层 之 后 ， 在 C 层 之 前 我 们 可 能 还 需要 同时 支持 多 种 协议 。 本 章 前 面 讲 到 的 

thrift、gRPC 和 http 并 不 是 一 定 只 选择 其 中 一 种 ， 有 时 我 们 需要 支持 其 中 的 两 种 ， 比 如 同一 
TEE ， 我 们 既 需 要 效率 较 高 的 thrift， 也 需要 方便 debug 的 Hp 入 口 。 即 除了 CLD 之 外 ， 
还 需要 一 个 单独 的 protocol 层 ， 负 责 处 理 各 种 交互 协议 的 细节 。 这 样 请 求 的 流程 会 变 成 下 面 
这 样 : 


protocol 


HTTP thrift 





controller 


logic 


logic 


这 样 我 们 controller 中 的 入 口 函 数 就 变 成 了 下 面 这 样 : 


func CreateOrder(ctx context.Context, req *CreateOrderStruct) (*CreateOrderRespStruct, er 


) 
Kil RR 


CreateOrder 有 两 个 参数 ，ctx 用 来 传 入 trace id 一 类 的 需要 串联 请 求 的 全 局 参数 ，req 里 存 
储 了 我 们 创建 订单 所 需要 的 所 有 输入 信息 。 返 回 结果 是 一 个 响应 结构 体 和 错误 。 可 以 认为 ， 
我 们 的 代码 运行 到 controller 层 之 后 ， 就 没有 任何 与 “协议 ”相关 的 代码 了 。 在 这 里 你 找 不 到 
http.Request， 也 找 不 到 http.ResponseWriter， 也 找 不 到 任何 与 thrift 或 者 gRPC 相关 的 字 
IR o 





在 protocol Æ > 4E3€ http 协议 的 大 概 代 码 如 下 : 


// defined in protocol layer 

type CreateOrderRequest struct { 
OrderID int64 '^json:"order id" 
人 


// defined in controller 
type CreateOrderParams struct { 
OrderID int64 


} 


func HTTPCreateOrderHandler(wr http.ResponseWriter, r *http.Request) { 
var req CreateOrderRequest 
var params CreateOrderParams 
ctx :- context.TODO() 
// bind data to reg 
bind(r, &req) 
// map protocol binded to protocol-independent 


map(req, params) 


logicResp,err :- controller.CreateOrder(ctx, &params) 
if err !- nil {} 
A 


理论 上 我 们 可 以 用 同一 个 request struct 组 合 上 不 同 的 tag， 来 达到 一 个 struct 来 给 不 同 的 协 
议 复 用 的 目的 。 不 过 遗憾 的 是 在 thrift 中 ，request struct 也 是 通过 IDL 生成 的 ， 其 内 容 在 自动 
生成 的 ttypes.go 文件 中 ， 我 们 还 是 需要 在 thrift 的 入 口 将 这 个 自动 生成 的 struct 映射 到 我 们 
logic 入 口 所 需要 的 struct 上 。gRPC 也 是 类 似 。 这 部 分 代码 还 是 需要 的 。 


聪明 的 读者 可 能 已 经 可 以 看 出 来 了 ， 协 议 细 节 处 理 这 一 层 实 际 上 有 大 量 重复 劳动 ， 每 一 个 接 
口 在 协议 这 一 层 的 处 理 ， 无 非 是 把 数据 从 协议 特定 的 struct( 例 如 http.Request，thrift 的 被 包 
装 过 了 ) 读 出 来 ， 再 绑 定 到 我 们 协议 无 关 的 struct 上 ， 再 把 这 个 struct 映射 到 controller 入 口 
的 struct 上 ， 这 些 代码 实际 上 长 得 都 差不多 。 差 不 多 的 代码 都 遵循 着 菜 种 模式 ， 那 么 我 们 可 
以 对 这 些 模式 进行 简单 的 抽象 ， 用 codegen 来 把 繁复 的 协议 处 理 代 码 从 工作 内 容 中 抽 离 出 
去 。 


先 来 看 看 http 对 应 的 struct ` thrift 对 应 的 struct 和 我 们 协议 无 关 的 struct 分 别 长 什么 样子 : 


// http request struct 

type CreateOrder struct ( 
OrderID int64 '^json:"order id" validate:"required"' 
UserID int64 '^json:"user id" validate:"required"^ 
ProductID int ^json:"prod id" validate:"required"" 
Addr string '^json:"addr" validate:"required"^ 


// thrift request struct 
type FeatureSetParams struct { 
DriverID int64 "thraft:"driverlID,1,required" 
OrderID int64 "thrift:"OrderID,2,required"' 
UserID int64 '"thrift:"UserID,3,required"^ 
ProductID int "thrift:"ProductID,4,required"' 
Addr string "thrift:"Addr,5,required"^ 


// controller input struct 
type CreateOrderParams struct { 
OrderID int64 
UserID int64 
ProductID int 
Addr string 


我 们 需要 通过 一 个 源 struct 来 生成 我 们 需要 的 http 和 thrift 入 口 代码 。 再 观察 一 下 上 面 定 义 的 
三 种 struct， 实 际 上 我 们 只 要 能 用 一 个 struct 生成 thrift 的 IDL， 以 及 http 服务 的 “IDL( 实 际 上 
就 是 带 json/form 相关 tag 的 struct 定义 》 就 可 以 了 。 这 个 初始 的 struct 我 们 可 以 把 struct 上 
的 http 的 tag # thrift 的 tag 揉 在 一 起 : 


type FeatureSetParams struct { 
DriverID int64 phrasi driverlD i nequrred Json: driver rdi 
OrderID int64 "thrift:"OrderID,2,required" json:"order id" 
UserID int64 '"thrift:"UserID,3,required" json:"user id" 
ProductID int "thrift:"ProductID,4,required" json:"prod id” 
Addr string "thrift:"Addr,5,required" json:"addr"^ 


然后 通过 代码 生成 把 thrift 的 IDL 和 http 的 request struct 都 生成 出 来 : 


type FeatureSetParams struct ( 


DriverlD int64 "thrift:"driverlD,1,required" json:"driver. id" 
OrderID int64 'thrift:^OrderID,2,required" json:"order id" 
UserID int64 ‘thrift:"UserlD,3,required" json:"user. id" 
ProductlD int "thrift:"ProductID,4,required" json:"prod id" 
Addr string "thrift:" Addr,5,required" json:"addr"^ 
} 
code generate code generate 
zi 
" ` 
thrift IDL type CreateOrder struct { 


OrderlD int64 `json:"order_id" validate:"required" 
UserlD int64 `json:"user_id" validate:"required" 
ProductID int 'json:"prod id" validate:"required'" 
Addr string 'json:"addr" validate:"required" 


} 
至 于 用 什么 手段 来 生成 ， 你 可 以 通过 go 语言 内 置 的 parser 读 取 文本 文件 中 的 Go 源 代码 ， 
然后 根据 ast 来 生成 目标 代码 ， 也 可 以 简单 地 把 这 个 源 struct 和 generator 的 代码 放 在 一 起 编 
i£ * ik struct 作为 generator 的 输入 参数 (这 样 会 更 简单 一 些 )， 都 是 可 以 的 。 


当然 这 种 思路 并 不 是 唯一 选择 ， 我 们 还 可 以 通过 解析 thrift 的 IDL， 生 成 一 套 http 接口 的 
struct。 如 果 你 选择 这 么 做 ， 那 整个 流程 就 变 成 了 这 样 


thrift IDL 
code generate code generate 
r4 EN 
type FeatureSetParams struct ( type CreateOrder struct { 
OrderlD int64 "thrift:"OrderlD,2,required" json:"order. id" OrderlD int64 'json:"order. id" validate:"required" 
UserlD int64 "thrift:"UserlD,3,required" json:"user. id” UserlD int64 'json:"user. id" validate:"required" 
ProductlD int "thrift:" ProductlD,4,required" json:"prod id" ProductlD int 'json:"prod id" validate:"required"" 
Addr string "thrift:"Addr,5,required" json:"addr" Addr string 'json:"addr" validate:"required'^ 


} } 


看 起 来 比 之 前 的 图 顺畅 一 点 ， 不 过 如 果 你 选择 了 这 么 做 ， 你 需要 自行 对 thrift 的 IDL 进行 解 
析 ， 也 就 是 相当 于 可 能 要 手写 一 个 thrift 的 IDL 的 parser， 虽 然 现 在 有 antlr 或 者 peg 能 帮 你 
简化 这 些 parser 的 书写 工作 ， 但 在 “解析 ”的 这 一 步 我 们 不 希望 引入 太 多 的 工作 量 ， 所 以 量力 
而 行 即 可 。 


既然 工作 流 已 经 成 型 ， 我 们 可 以 琢磨 一 下 怎么 让 整个 流程 对 用 户 更 加 友好 。 


比如 在 前 面 的 生成 环境 引入 GUI 或 者 web 页 面 ， 只 要 让 用 户 点 点 鼠标 就 能 生成 SDK， 
就 靠 读者 自己 去 探索 了 。 


虽然 我 们 成 功 地 使 自己 的 项 目 在 入 口 支 持 了 多 种 交互 协议 ， 但 是 还 有 一 些 问题 没有 解决 。 本 
节 中 所 叙述 的 分 层 没 有 将 middleware 作为 项 目的 分 层 考 虑 进去 。 如 果 我 们 考虑 middleware 
的 话 ， 请 求 的 流程 是 什么 样 的 ? 


http middleware some thrift stuff 
"ns 
SS "m 
controller 

Y 

logic 
Y 

logic 


之 前 我 们 学 习 的 middleware 是 和 http WRR X 83 > WRA thrift 中 看 起 来 没有 和 http 
中 对 等 的 解决 这 些 非 功能 性 逻辑 代码 重复 问题 的 middleware。 所 以 我 们 在 图 上 写 thrift 
stuff 。 这 些 stuff 可 能 需要 你 手写 去 实现 ， 然 后 每 次 增加 一 个 新 的 thrift 接口 ， 就 需要 去 写 
一 人 遍 这 些 非 功能 性 代码 。。 


这 也 是 很 多 企业 项 目 所 面临 的 真实 问题 ， 遗 憾 的 是 开源 界 并 没有 这 样 方便 的 多 协议 
middleware 解决 方案 。 当 然 了 ， 前 面 我 们 也 说 过 ， 很 多 时 候 我 们 给 自己 保留 的 http 接口 只 是 
用 来 做 debug， 并 不 会 暴露 给 外 人 用 。 这 种 情况 下 ， 这 些 非 功能 性 的 代码 只 要 在 thrift 的 代码 
中 完成 即 可 。 
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5.9. À J£ X "p fe AIB test 


中 型 的 互联 网 公司 往往 有 着 以 百 万 计 的 用 户 ， 而 大 型 互联 网 公司 的 系统 则 可 能 要 服务 千 万 级 
甚至 亿 级 的 用 户 需求 。 大 型 系统 的 请 求 流入 往往 是 源源 不 断 的 ， 任 何 风 吹 草 动 ， 都 一 定 会 有 
最 终 用 户 感受 得 到 。 例 如 你 的 : jp db UR eie 来 的 请 求 ， 而 这 时 候 依赖 你 
的 系统 没有 做 任何 容错 ， 那 么 错误 就 会 一 直 向 上 抛 出 ， 直 到 触 达 最 终 用 户 。 形 成 一 次 对 
用 户 切 切实 实 的 伤害 。 这 种 伤 25 EREM P f) app E di — 4 1E JH] P AR IR VE 
符 串 ， 用 户 只 要 刷新 一 下 页 面 就 可 以 忘记 这 件 事 。 但 也 可 能 会 让 正在 心急 如 焚 地 和 几 万 竞争 
对 手 同 时 抢夺 秒杀 商品 的 用 户 ， 因 为 代码 上 的 小 问题 ， 丙 失掉 了 先 发 优 势 ， 与 自己 蹲 了 几 个 
月 的 心仪 产品 失之交臂 。 对 用 户 的 伤害 有 多 大 ， 取 决 于 你 的 系统 对 于 你 的 用 户 来 说 有 多 重 
要 。 


不 管 怎 么 说 ， 在 大 型 系统 中 容错 是 重要 的 ， 能 够 让 系统 按 百 分 比 ， 分 批 次 到 达 最 终 用 户 ， 也 
是 很 重要 的 。 虽 然 当今 的 互联 网 公司 系统 ， 名 义 上 会 说 自己 上 线 前 都 经 过 了 充分 懂 重 严格 的 
MR » RACM AIHE] T > RA bug 总 是 在 所 难免 的 。 即 使 代码 没有 bug， 分 布 式 服 
务 之 间 的 协作 也 是 可 能 出 现 “ 有 逻辑 "上 的 非 技 术 问 题 的 。 


这 时 候 ， 灰 度 发 布 就 显得 非常 重要 了 ， 灰 度 发 布 也 称 为 金 丝 短 发 布 ， 传 说 17 世纪 的 英国 矿井 
2 瓦斯 气体 非常 敏感 ， 金 丝 管 即 会 死亡 ， 但 金 丝 管 的 
致死 量 oui ius , E 来 当成 他 们 的 瓦斯 检测 工具 。 互 联网 系统 的 灰 度 
发 布 一 般 通过 两 种 方式 实 


在 对 系统 的 昌 功 能 进行 升级 迭代 时 ， 第 一 种 方式 用 的 比较 多 。 新 功能 上 线 时 ， 第 二 种 方式 用 
的 比较 多 。 当 然 ， 对 比较 重要 的 老 功能 进行 较 大 幅度 的 修改 时 ， 一 般 也 会 选择 按 业务 规则 来 
进行 发 布 ， 因 为 直接 全 量 开 放 给 所 有 用 户 风 险 实 在 太 大 。 


过 分 批 次 部 署 实现 灰 度 发 布 


ss 容器 ) 上 ， 我 们 把 这 7 个 实例 分 为 三 组 ， 
按照 先后 顺序 ， 分 别 有 1-2-4-8 台 机 器 ， 保 证 每 次 扩展 时 大 概 都 是 二 倍 的 关系 。 
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为 什么 要 用 2 倍 ? 这 样 能 够 保证 我 们 不 管 有 多 少 台 机 器 ， 都 不 会 把 组 划分 得 太 多 。 例 如 1024 
hs um m 全 部 部 署 完毕 。 


这 样 我 们 上 线 最 开始 影响 到 的 用 户 在 整体 用 户 中 占 的 比例 也 不 大 ， 比 如 1000 台 机 器 的 服务 ， 
我 们 上 线 后 如 果 出 现 问题 ， 也 只 影响 1/1000 的 用 户 。 如 果 10 组 完全 平均 分 ， 那 一 上 线 立 刻 
就 会 影响 1/10 的 用 户 ，1/10 的 业务 出 问题 ， 那 可 能 对 于 公司 来 说 就 已 经 是 一 场 不 可 挽回 的 事 
故 了 。 


在 上 线 时 ， 最 有 效 的 观察 手法 是 查看 程序 的 错误 日 志 ， 如 果 较 明显 的 逻辑 错误 ， 一 般 错误 日 
志 的 滚动 速度 都 会 有 肉眼 可 见 De ne dn ge 
的 监控 系统 ， 所 以 在 上 线 过 程 中 ， 也 可 以 通过 观察 监控 曲线 ， 来 判断 是 否 有 异常 发 生 。 


如 果 有 异常 情况 ， 首 先 要 做 的 自然 就 是 回 滚 了 。 


通过 业务 规则 进 度 发 布 


常见 的 灰 度 策略 有 多 种 ， 较 为 简单 的 需求 ， 例 如 我 们 的 策略 是 要 按照 千 分 比 来 发 布 ， 那 么 我 
们 可 以 用 用 户 id、 手 机 号 、 用 户 设备 信息 ， 等 等 ， 来 生成 一 个 简单 的 哈 希 值 ， 然 后 再 求 模 ， 
用 伪 代 码 表示 一 下 : 


// pass 3/1000 
func passed() bool { 
key := hashFunctions(userID) % 1000 
if key «- 2 ( 
return true 


} 


return false 


可 选 规则 

常见 的 灰 度 发 布 系统 会 有 下 列 规则 提供 选择 : 
按 城 市 发 布 

按 概率 发 布 

按 百 分 比 发 布 

按 白 名 单 发 布 

按 业 务 线 发 布 

按 UA X 7; (app ` web ` pc) 

按 分 发 渠道 发 布 


DawnN > 


因为 和 公司 的 业务 相关 ， 所 以 城市 、 业 务 线 、UA、 分 发 渠道 这 些 都 可 能 会 被 直接 编码 在 系统 
里 ， 不 过 功能 其 实 大 同 小 异 。 


按 白 名 单 发 布 比 较 简 单 ， 功 能 上 线 时 ， 可 能 我 们 希望 只 有 公司 内 部 的 员工 和 测试 人 员 可 以 访 
问 到 新 功能 ， 会 直接 把 账号 、 邮 箱 写 入 到 白 名 单 ， 拒 绝 其 它 任何 账号 的 访问 。 


按 概率 发 布 则 是 指 实 现 一 个 简单 的 函数 : 


func isTrue() bool { 


return true/false according to the rate provided by user 


} 


其 可 以 按照 用 户 指 定 的 概率 返回 true/false > 37A » true 的 概率 + false 的 概率 = 10096 » 3X ^ 
函数 不 需要 任何 输入 。 


按 百 分 比 发 布 ， 是 指 实现 下 面 这 样 的 函数 : 


func isTrue(phone string) bool { 
if hash of phone matches { 
return true 


} 


return false 


这 种 情况 可 以 按照 指定 的 百分比 ， 返 回 对 应 的 true 和 false， 和 上 面 的 单纯 按照 概率 的 区 别 是 
这 里 我 们 需要 调用 方 提 Re ， 我 们 以 该 输入 参数 作为 源 来 计算 哈 希 ， 并 以 
哈 硕 后 的 结果 来 求 模 ， 并 返回 结果 。 这 样 可 以 保证 同一 个 用 户 的 返回 结果 多 次 调用 是 一 致 
的 ， 在 下 面 这 种 场景 下 ， 中 结果 可 预期 的 灰 度 算法 : 


dese eere t 

--------- | set.V2 |---------------------+ 

( user 1 ) +-------- + | 

2 ; | | 

+-------- 十 | | 

+-------------- | set.V2 | | | 

| o ERE * | | 

| | | | 

V | | V 
+------------- + | | +------------- + 
| storage v1 | | | | storage v2 | 
+------------- 十 | | +------------- + 

| | | | 

| | | | 

| | | | 

| V | | 

| LE E | | 

+------------- >| get.V2 | | | 

T-------- 十 | | 

| | 

v l 

Mitte efe ette 十 | 

| get.V2 | 


如 何 实现 一 套 灰 度 发 布 系统 


前 面 也 提 到 了 ， 提 供给 用 户 的 接口 大 概 可 以 分 为 和 业 A 
稍微 复杂 一 些 的 哈 希 灰 度 。 我 们 来 分 别 看 看 怎么 实现 这 样 的 灰 度 系统 (函数 ) 。 


业务 相关 的 简单 灰 度 


公司 内 一 般 都 会 有 公共 的 城市 名 字 和 id 的 映射 关系 ， 如 果 业 务 只 涉及 中 国 国内 ， 那 么 城市 数 
量 不 会 特别 多 ， 且 id 可 能 都 在 10000 范围 以 内 。 那 么 我 们 只 要 开辟 一 个 一 万 大 小 左右 的 bool 
数组 ， 就 可 以 满足 需求 了 : 


var cityID20pen = [12000]bool[) 


func init() { 
readConfig() 
for i:z0;i«len(cityID20pen);i--* { 
if city i is opened in configs { 
cityID20pen - true 
} 


} 


func isPassed(cityID int) bool { 
return cityID20pen[cityID] 
} 


如 果 公 司 给 citylID 赋 的 值 比 较 大 ， 那 么 我 们 可 以 考虑 用 map 来 存储 映射 关系 ，map 的 查询 比 
数组 稍 慢 ， 但 扩展 会 灵活 一 些 : 


var cityID20pen = map[int]struct{}{} 


func init() { 
readConfig() 
for _, city := range openCities { 
cityID20pen[city] = struct{}{} 
} 
} 


func isPassed(cityID int) bool { 
if _, ok := cityID20pen[cityID]; ok { 
return enue 


} 


return false 


按 白 名 单 、 按 业务 线 、 按 UA、 按 分 发 渠道 发 布 ， 本 质 上 和 按 城市 发 布 是 一 样 的 ， 这 里 就 不 再 


按 概率 发 布 稍微 特殊 一 些 ， 不 过 不 考虑 输入 实现 起 来 也 很 简单 : 


func init() { 
rand.Seed(time.Now().UnixNano()) 


} 


// rate 7j 0-100 
func isPassed(rate int) bool { 
if rate >= 100 { 
return enue 


} 


if rate > 0 && rand.Int(100) > rate { 
return true 


} 


return false 


注意 初始 化 种 子 。 


哈 布 算 法 


求 哈 希 可 用 的 算法 非常 多 ， 比 如 md5，crc32，sha1 等 等 ， 但 我 们 这 里 的 目的 只 是 为 了 给 这 
些 数据 做 个 映射 ， 并 不 想 要 因为 计算 哈 希 消耗 过 多 的 cpu， 所 以 现在 业界 使 用 较 多 的 算法 是 
murmurhash， 下 面 是 我 们 对 这 些 常见 的 hash 算法 的 简单 benchmark : 


hash.go: 


package main 

import "crypto/md5" 

import "crypto/sha1" 

import "github.com/spaolacci/murmur3" 
var str = "hello world" 

func md5Hash() [i6]byte { 


return md5.Sum([]byte(str)) 


func shaiHash() [20]byte { 
return shaid.Sum([]byte(str)) 


func murmur32() uint32 ( 
return murmur3.Sum32([]byte(str)) 


func murmur64() uint64 ( 
return murmur3.Sume4([]byte(str)) 


hash test.go 


package main 


import "testing" 


func BenchmarkMD5(b *testing.B 
for i:-0;ic«b.N; ir ( 
md5Hash( ) 


func BenchmarkSHAi1(b *testing. 
for i:-0;ic«b.N; it ( 
shad1Hash( ) 


func BenchmarkMurmurHash32(b *testing.B) { 


for i:-0;icb.N; it ( 
murmur32() 


func BenchmarkMurmurHash64(b *testing.B) { 


for i :— 0; 1 « b.N; ict f 
murmur64( ) 


—/t/g/hash bench git:master >>》go test -bench-. 


goos: darwin 
goarch: amd64 


BenchmarkMD5 -4 10000000 
BenchmarkSHA1-4 10000000 
BenchmarkMurmurHash32 -4 50000000 
BenchmarkMurmurHash64 - 4 20000000 

PASS 

ok ./Users/caochunhui/test/go/hash bench 


J 


B) { 


180 ns/op 
211 ns/op 
25.7 ns/op 
66.2 ns/op 


7.050s 


可 见 murmurhash 相 比 其 它 的 算法 有 三 倍 以 上 的 性 能 提升 。 


分 布 是 否 均 匀 


我 们 先 以 15810000000 开头 ， 造 一 千 万 个 和 手机 号 类 似 的 数字 ， 然 


个 桶 ， 并 观察 计数 是 否 均 匀 : 


后 


将 计 


A 


package main 


import ( 
ENES 


"github.com/spaolacci/murmur3" 


var bucketSize - 10 


func main() { 
var bucketMap = map[uint32]int{} 
for i := 15000000000; i < 15000000000410000000; i++ { 
hashInt := murmur64(fmt.Sprint(i)) % bucketSize 
bucketMap [hashInt]-- 


à 
fmt.Println(bucketMap) 


func murmur32(p string) uint64 { 
return murmur3.Sume4([]byte(p)) 


map[7:999475 5:1000359 1:999945 6:1000200 3:1000193 9:1000765 2:1000044 4:1000343 8:10008 


六 — 


偏差 基本 都 在 1/100 以 内 ， 是 可 以 接受 的 。 





5.11. Load-Balance 负载 均衡 


本 节 将 会 讨论 常见 的 web 后 端 服务 之 间 的 负载 均衡 手段 。 


第 见 的 负载 均衡 思路 


如 果 我 们 不 考虑 均衡 的 话 ， 现 在 有 nm 个 endpoint， 我 们 完成 业务 流程 实际 上 只 需要 从 这 mn 个 
中 挑 出 其 中 的 一 个 。 有 几 种 思路 : 


1. dde 例如 上 次 选 了 第 一 台 ， 那 么 这 次 就 选 第 二 台 ， 下 次 第 三 台 ， 如 果 已 经 到 
一 台 ， 那 么 下 一 次 从 第 一 台 开始 。 这 种 情况 下 我 们 可 以 把 endpoint 都 存储 在 数组 中 ， 
次 请 x c E. 将 一 个 索引 后 移 即 可 。 在 移 到 尽头 时 再 移 回 数组 开头 处 。 


2， 随 机 挑 一 个 : 每 次 都 随机 挑 ， 丨 随机 伪 随 机 均 可 。 设 选择 第 x 台 机 器 ， 那 么 X 可 描述 为 


rand.Intn() %n ° 
3. 根据 某 种 权重 ， 对 下 游 endpoints 进行 排序 ， 选 择 权重 最 大 /小 的 那 一 个 。 


当然 了 ， 实 际 场景 我 们 不 可 能 无 脑 轮 询 或 者 无 脑 随 机 ， 如 果 对 下 游 请 求 失败 了 ， 我 们 还 需要 
某 种 机 制 来 进行 重 试 ， 如 果 纯粹 的 随机 算法 ， 存 在 一 定 的 可 能 性 使 你 在 下 一 次 仍然 随机 到 这 
次 的 问题 节点 T 


我 们 来 看 一 个 生产 环境 的 负载 均衡 案例 。 


一 种 随机 负载 均衡 算法 


考虑 到 我 们 需要 随机 选取 每 次 发 送 请 求 的 endpoint， 同 时 在 遇 到 下 游 返 回 错误 时 换 其 它 节 点 
重 试 。 所 以 我 们 设计 一 个 大 小 和 endpoints 数组 大 小 一 致 的 索引 数组 ， 每 求 ， 我 们 
对 索引 数组 做 洗 牌 ， 然 后 取 第 一 个 元 素 作 为 选中 的 服务 节点 ， 如 果 请 求 失败 ， 那 么 选择 下 一 
个 节点 重 试 ， 以 此 类 推 : 


var endpoints = []string { 

"100169762: 1:3232% 

2100169162 :32: 323247 
1100.691162 :42:323217 
151190:69162:81:3232'" 
"1007690627 111323217 
5:100:69/162::113:3232'7 
210069162 71017323217 


// 重点 在 这 个 shuffle 
func shuffle(slice []int) { 
for i := 0; i < len(slice); it+ { 
a := rand.Intn(ien(slice)) 
b := rand.Intn(len(slice)) 
slice[a], slice[b] - slice[b], slice[a] 


func request(params map[string]interface[)) error { 
var indexes = []int [0,1,2,3,4,5,6) 
var err error 


shuffle(indexes) 
maxRetryTimes :- 3 
idx := 0 
for i := 0; i < maxRetryTimes; i++ { 
err - apiRequest(params, indexes[idx]) 
if err == nil { 
break 
} 
idx++ 
} 
if err != nil { 
// logging 
return err 
} 


return nil 


我 们 循环 一 遍 slice， 两 两 交换 ， 这 个 和 我 们 平常 打牌 时 常用 的 洗 牌 方法 类 似 。 看 起 来 没有 什 
么 问题 。 


有 没有 什么 问题 ? 


监 的 没有 问题 么 ?了 实际 上 还 是 有 问题 的 。 这 段 简短 的 程序 里 有 两 个 隐藏 的 隐患 : 


1. 没有 随机 种 子 。 在 没有 随机 种 子 的 情况 下 ，rand.Intn 返回 的 伪 随 机 数 序列 是 固定 的 。 


2， 洗 牌 不 均匀 ， 会 导致 整个 数组 第 一 个 节点 有 大 概率 被 选中 ， 并 且 多 个 节点 的 负载 分 布 不 
均衡 。 


第 一 点 比较 简单 ， 应 该 不 用 在 这 里 给 出 证 明了 “。 关 于 第 二 点 ， 我 们 可 以 用 概率 知识 来 简单 证 

明 一 下 。 假 设 每 次 挑选 都 是 丨 随机 ， 我 们 假设 第 一 个 位 置 的 endpoint 在 len(slice) 次 交换 中 

都 不 被 选中 的 概率 是 ((6/7)*(6/7))^7 = 0.34。 而 分 布 均匀 的 情况 下 ， 我 们 肯定 希望 被 第 一 个 元 
素 在 任意 位 置 上 分 布 的 概率 均等 ， 所 以 其 被 随机 选 到 的 概率 应 该 2 1/7 = 0.14 ° 


显然 ， 这 里 给 出 的 洗 牌 算法 对 于 任意 位 置 的 元 素来 说 ， 有 30% 的 概率 不 对 其 进行 交换 操作 。 
所 以 所 有 元 素 都 倾向 于 留 在 原来 的 位 置 。 因 为 我 们 每 次 对 shuffle 数组 输入 的 都 是 同一 个 序 
列 ， 所 以 第 一 个 元 素 有 更 大 的 概率 会 被 选中 。 在 负载 均衡 的 场景 下 ， 也 就 意味 着 endpoints 数 
组 中 的 第 一 人 台 机 器 负载 会 比 其 它 机 器 高 不 少 ( 这 里 至 少 是 3 倍 以 上 ) 。 


修正 后 的 洗 牌 算法 


从 数学 上 得 到 过 证 明 的 还 是 经 典 的 fisher-yates 算法 ， 主 要 思路 为 每 次 随机 挑选 一 个 值 ， 放 在 
数组 末尾 。 然 后 在 n-1 个 元 素 的 数组 中 再 随机 挑选 一 个 值 ， 放 在 数组 末尾 ， 以 此 类 推 。 


func shuffle(indexes []int) { 
for i:zlen(indexes); i>0; i-- ( 
lastIdx := i - 1 
idx := rand.Int(i) 
indexes[lastIdx], indexes[idx] = indexes[idx], indexes[lastIdx] 


在 Go 的 标准 库 中 实际 上 已 经 为 我 们 内 置 了 该 算法 : 


func shuffle(n int) []int { 
b := rand.Perm(n) 
return b 


在 当前 的 场景 下 ， 我 们 只 要 用 rand.Perm 就 可 以 得 到 我 们 想 要 的 索引 数组 了 9 


zk 集群 的 随机 节点 挑选 问题 


本 节 中 的 场景 是 从 N 个 节点 中 选择 一 个 节点 发 送 请 求 ， 初 始 请 求 结束 之 后 ， 后 续 的 请 求 会 重 
新 对 数组 洗 牌 ， 所 以 每 两 个 请 求 之 间 没 有 什么 关联 关系 。 因 此 我 们 上 面 的 洗 牌 算法 ， 理 论 上 
不 初始 化 随机 库 的 种 子 也 是 不 会 出 什么 问题 的 。 


但 在 一 些 特殊 的 场景 下 ， 例 如 使 用 zk 时 ， 客 户 端 初始 化 从 多 个 服务 节点 中 挑选 一 个 节点 后 ， 
2 节 点 建立 长 连接 的 。 并 且 之 后 如 果 有 请 求 ， 也 都 会 发 送 到 该 节点 去 。 直 到 该 节点 不 

> TAE endpoints 列表 中 挑选 下 一 个 节点 。 在 这 种 场景 下 ， 我 们 的 初始 连接 节点 选择 就 
ee c 
起 到 负载 均衡 的 目的 。 如 果 在 日 常 开 发 中 ， 你 的 业务 也 是 类 似 的 场景 ， 也 务必 考虑 一 下 是 否 
会 发 生 类 似 的 情况 。 为 rand 库 设 置 种 子 的 方法 : 


rand.Seed(time.Now().UnixNano()) 


之 所 以 会 有 上 面 这 人 
直到 2016 年 早 些 时 候 ， 这 个 问题 才 被 修正 。 


负载 均衡 算法 效果 验证 


我 们 这 里 不 考虑 加 权 负 载 均 衡 的 情况 ， 既 然 名 字 是 负 Rd 。 那 么 最 重要 的 就 是 均衡 。 我 们 
把 开篇 中 的 shuffle 算法 ， 和 之 后 的 fisher yates 算法 的 结果 进行 简单 地 对 比 : 


package main 


import ( 
LIT ta 
"math/rand" 
"time" 

) 


func init() { 
rand.Seed(time.Now().UnixNano()) 


} 
func shufflei(slice []int) { 
for i:-2 0; i « len(slice); i-** 1 
a := rand.Intn(ien(slice)) 


b := rand.Intn(len(slice)) 
slice[a], slice[b] - slice[b], slice[a] 


} 
} 
func shuffle2(indexes []int) { 
for i :- len(indexes); i > 0; i-- { 
lastIdx := i - 1 
idx := rand.Intn(i) 


indexes[lastIdx], indexes[idx] = indexes[idx], indexes[lastIdx] 


func main() { 
var cnt1 = map[int]int{} 
for i := 0; i < 1000000; itt ( 
var si = []int{0; 1, 2, 3; 4, 5, 6} 
shufflei(sl) 
cnti[sl[0]]-** 


var cnt2 = map[int]int[) 
for i :- 0; i « 1000000; i*-* ( 
Mates ntn 203 res 0 


shuffle2(sl) 
cnt2[s1[0]]-** 
} 
fmt.Println(cnti, "\n", cnt2) 
} 
输出 


map[0:224436 1:128780 5:129310 6:129194 2:129643 3:129384 4:129253] 
map[6:143275 5:143054 3:143584 2:143031 1:141898 0:142631 4:142527] 


分 布 结果 和 我 们 推导 出 的 理论 是 一 致 的 。 
基于 一 致 性 哈 硕 的 负载 均衡 


ketama hash 


第 六 章 分 布 式 系统 


Go 语言 号 称 是 互联 网 时 代 的 C 语 言 。 现 在 的 互联 网 系统 已 经 不 是 以 前 的 一 个 主机 搞定 一 切 的 
时 代 ， 互 联网 时 代 的 服务 后 台 有 大 量 的 分 布 式 系统 构成 ， 任 何 单一 后 台 服 务 器 节点 的 故障 并 
不 会 导致 整个 系统 的 停机 。 同 时 以 青云 、 阿 里 云 、 腾 讯 云 为 代表 的 云 厂商 崛起 标志 着 云 时 代 
的 到 来 ， 在 云 时 代 分 布 式 编程 将 成 为 一 个 基本 技能 。 而 基于 Go 语言 构建 的 Docker、K8s 等 系 
统 正 是 推动 了 云 时 代 的 提前 到 来 。 本 章 将 简单 讨论 如 何 使 用 Go 语言 开发 各 种 分 布 式 系统 。 


6.1. x EX 


TODO 


6.2. Raft i 


TODO 


6.3. 分 布 式 哈 布 


TODO 


6.4. 分 布 式 队列 


TODO 


6.5. 分 布 式 缓存 


TODO 


6.6. etcd 


TODO 


6.7. confd 


TODO 


6.8. 分 布 式 锁 


TODO 


6.9. 分 布 式 任务 调度 系统 


TODO 


6.10. 延 时 任务 系统 


TODO 


6.11. Kubernetes 


TODO 


6.12. 补充 说 明 


TODO 


第 七 章 Go 和 AST 


AST 是 抽象 语法 树 的 缩写 (abstract syntax tree) ， 一 般 可 以 用 一 个 树 型 结构 表示 源 代码 的 抽 
象 语法 结构 。 比 如 一 个 算术 表达 式 可 以 用 AST 表 示 ，if 分 支 结 构 、for 循 环 结 构 也 可 以 用 AST 表 
示 。 因 为 树 是 一 个 任意 分 又 的 ，AST 也 可 以 非常 容易 if 分 支 、for 循 环 等 秦 套 的 结构 。 了 解 AST 
不 仅仅 可 以 加 深 对 语言 本 身 的 理解 ， 基 于 AST 也 可 以 做 很 多 有 意义 的 事情 (比如 分 析 某 类 型 
的 BUG、 进 行 某 种 优化 等 ) 。 更 让 人 兴奋 的 是 Go 语言 标准 库 已 经 内 置 了 强大 易 用 的 AST 库 ， 
让 我 们 了 解 一 下 这 种 神秘 的 技术 吧 。 


第 八 章 Go 和 那些 生产 力 工 具 


在 日 常 开发 中 我 们 难免 遇 到 很 多 重复 劳动 ， 程 序 员 的 天 性 使 他 们 更 倾向 于 消灭 重复 劳动 。 哪 
怕 花 半 小 时 去 写 脚 本 ， 也 一 定 要 消灭 五 分 钟 的 痛苦 。 这 样 才 能 让 生活 更 美好 。 

本 章 会 介绍 一 些 让 你 的 生活 更 美好 (或 许 你 会 认为 更 糟糕 ) 的 工具 ， 帮 助 你 提高 工作 效 府 ， 消 灭 
重复 劳动 ， 或 是 提升 自己 的 代码 质量 。 如 果 你 之 前 从 来 没有 想 过 借助 工具 来 提升 自己 的 幸福 
感 ， 那 么 希望 这 一 章 能 够 帮 你 打开 思路 ， 成 为 一 个 掌握 十 八 般 兵器 ， 并 在 日 后 的 开发 工作 中 
努力 追求 一 劳 永 选 的 工程 师 。 


常见 的 坑 和 解决 方案 ; 第 二 部 


=o 


~ 


附录 A : Go 语言 常见 坑 


这 里 列举 的 Go 语言 常见 坑 都 是 符合 Go 语言 语法 的 , 可 以 正常 的 编译 , 但 是 可 能 是 运行 结果 错 


误 ， 或 者 是 有 资源 泄漏 的 风险 . 


NA 日 ^M 
数组 是 值 传递 
在 函数 调用 参数 中 , 数组 是 值 传递 , 无 法 通过 修改 数组 类 型 的 参数 返回 结果 


func main() { 
= lS me 2 


func(arr [3]int) { 
arr[0] = 7 
fmt.Println(arr) 
(x) 


fmt.Println(x) 


必要 时 需要 使 用 切片 


map 人 遍历 是 顺 友 不 固定 
map 是 一 种 hash 表 实现 , 每 次 遍历 的 顺序 都 可 能 不 一 样 . 


func main() { 


m := map[string]stringi( 
purum 
POT MO 
pou 

} 

for k, v := range m { 


println(k, v) 


在 局 部 作用 域 中 , 命名 的 返回 值 内 同名 的 局 部 变量 屏蔽 ; 


func Foo() (err error) { 
if err := Bar(); err != nil { 
return 


} 


return 


recover fi # defer $% žr i513 
recover4ii j& 45 ZAL AAA Esp 85 JE 36, 直接 调用 时 无 效 : 


func main() { 
recover() 
panic(1i) 


直接 defer 调 用 也 是 无 效 : 


func main() { 
defer recover() 
panic(1i) 


defer? M tt 2 JZ dk E 4 45 7o 3c: 


func main() { 
defer func() { 
func() 4 recover() }() 


RC) 
panic(1i) 


必须 在 defer 函 数 中 直接 调用 才 有 效 : 


func main() { 
defer func() 1 
recover() 


}() 
panic(1) 


main à žr 4€ AT 3& m 
后 台 Goroutine 无 法 保证 完成 任务 . 


func main() { 
go println("hello") 
} 


通过 Sleep 来 回避 并 发 中 的 问题 
休眠 并 不 能 保证 输出 完整 的 字符 串 : 


func main() { 
go println("hello") 
time.Sleep(time.Second) 


类 似 的 还 有 通过 插入 调度 语句 : 


func main() { 
go println("hello") 
runtime.Gosched() 


独占 CPU 导致 其 它 Goroutine 饿 死 
Goroutine 是 协作 式 调度 , Goroutine 本 身 不 会 主动 放弃 CPU: 


func main() { 
runtime.GOMAXPROCS(41) 


go func() 1 


for aes O STE t 
fmt.Println(i) 


解决 的 方法 是 在 for 循 环 加 入 runtime.Gosched() 调 度 函 数 : 


func main() { 
runtime.GOMAXPROCS(1) 


go func() 1 
for i:-0;i« 10; itk ( 
fmt.Println(i) 
} 
}() 
for { 


runtime.Gosched() 


} 


或 者 是 通过 阻塞 的 方式 避免 CPU 占用 : 


func main() { 
runtime.GOMAXPROCS(1) 


go func() (1 
fori = 0 I cs Ioni 
fmt.Println(i) 
} 
}() 
select{} 


不 同 Goroutine 之 间 不 满足 顺序 一 致 性 内 存 模 型 


为 在 不 同 的 Goroutine, main 远 数 可 能 无 法 观测 到 done 的 状态 变化 , 那么 for 循 环 会 陷入 死 循 
环 : 


var msg string 
var done bool - false 


func main() { 
runtime .GOMAXPROCS(1) 


go func() { 
msg = "hello, world" 
done = true 


}() 
for { 
if done { 
println(msg) 
break 
} 
} 


解决 的 办 法 是 用 显示 同步 : 


var msg string 
var done - make(chan bool) 


func main() { 
runtime.GOMAXPROCS(1) 


go func() 1 


msg - "hello, world" 
done «- true 


}() 


<-done 
println(msg) 


闭 包 错误 引用 同一 个 变量 


func main() { 


fon SOL ETE 5 MICE EET 
defer func() { 
println(i) 
140 
} 


PM ROREM 


func main() { 


(OT 198: — 05 a b MSIE EET 
i := i 
defer func() { 
println(i) 
T6) 
^ 


func main() { 


for a —q0, SEE Mb EIC TS TI 
defer func(i int) { 
println(i) 
(i) 
} 


在 循环 内 部 执行 defer 语 名 
defer 在 函数 退出 时 才能 执行 , 在 for 执 行 defer 会 导致 资源 延迟 释放 : 


func main() { 


ipo e gE loe a Mb IEEE T 
f, err :- os.Open("/path/to/file") 
if err != nil { 


log.Fatal(err) 


} 
defer f.Close() 


解决 的 方法 可 以 在 for 中 构造 一 个 局 部 函数 , 在 局 部 函数 内 部 执行 defer: 


func main() { 


oe ai ETE db IE EET 
func() { 
f, err := os.Open("/path/to/file") 
if err !- nilí( 


log.Fatal(err) 


j 
defer f.Close() 


0 


切片 会 导致 整个 底层 数组 被 锁定 


切片 会 导致 整个 底层 数组 被 锁定 ,底层 数组 无 法 释放 内 存 . 如 果 底 层 数 组 较 大 会 对 内 存 产 生 很 
大 的 压力 . 


func main() { 
headerMap := make(map[string][]byte) 


fom ab ES NOR Bios calme T 
name := "/path/to/file" 
data, err :- ioutil.ReadFile(name) 
if err != nil { 
log.Fatal(err) 
} 
headerMap[name] = data[:1] 
} 


// do some thing 


解决 的 方法 是 将 结果 克隆 一 份 , 这 样 可 以 释放 底层 的 数组 : 


func main() { 
headerMap :- make(map[string][]byte) 


Hon 196:— 0 SET abr EISE EET 
name := "/path/to/file" 
data, err :- ioutil.ReadFile(name) 
if err !- nil ( 
log.Fatal(err) 


} 
headerMap[name] = append([]byte{}, data[:1]...) 


// do some thing 


空 指 针 和 空 接 口 不 等 价 
比如 返回 了 一 个 错误 指针 , 但 是 并 不 是 空 的 error 接 口 : 


func returnsError() error { 
var p *MyError = nil 
if bad() 1 
p = ErrBad 
} 


return p // Will always return a non-nil error. 


内 存 地 址 会 变化 


0 语言 中 对 象 的 地 址 可 能 发 生变 化 , 因此 指针 不 能 从 其 它 非 指 针 类 型 的 值 生成 : 


func main() { 
var x int - 42 


var p uintptr - uintptr(unsafe.Poiner(&x)) 
runtime.GC() 


var px *int - (*int)(unsafe.Poiner(p)) 
println(*px) 


当 内 存 发 送 变化 的 时 候 , 相关 的 指针 会 同步 更 新 , 但 是 非 指针 类 型 的 uintptr 不 会 做 同步 更 新 . 
同 理 , cgo 中 也 不 能 保存 Go 对 象 地址 ， 


Goroutine;* % 


Go 语言 是 带 内 存 自动 回收 的 特性 ， 因 此 内 存 一 般 不 会 泄漏 。 但 是 Goroutine 确 存在 泄漏 的 情 
况 ， 同 时 泄漏 的 Goroutine 引 用 的 内 存 同 样 无 法 被 回收 。 


func main() { 


ch := func() «-chan int { 
ch := make(chan int) 
go func() 1 
forie IoIB 9 lamp E 
ch «- i 
} 
O 
return ch 
}() 
for v := range ch { 
fmt.Println(v) 
ifvz-51( 
break 
y 
} 


+n P E 6 Goroutine H F 3& 4 A. A ZR ZU 7|] * main AA P 4 d 7$ 9] » 142 3: breakst 
出 for 循 环 的 时 候 ， 后 台 Goroutine 就 处 于 无 法 被 回收 的 状态 了 。 


我 们 可 以 通过 context 包 来 避免 这 个 问题 : 


func main() { 


ctx, cancel :- context.WithCancel(context.Background()) 
ch := func(ctx context.Context) «-chan int { 
ch := make(chan int) 
go func() (1 
for a ui ed: 
select ( 


case «- ctx.Done(): 
return 
case ch «- i: 


} 
} 
HO 
return ch 
}(ctx) 
for v :- range ch { 
fmt.Println(v) 
if v == 5 
cancel() 
break 
} 


当 main 函 数 在 break 跳 出 循环 时 ， 通 过 调用 cancel) 来 通知 后 台 Goroutine 退 出 ， 这 样 就 避免 
了 Goroutine 的 泄漏 。 
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